logo

Învățare automată nesupravegheată

În subiectul anterior, am învățat învățarea automată supravegheată în care modelele sunt antrenate folosind date etichetate sub supravegherea datelor de antrenament. Dar pot exista multe cazuri în care nu avem date etichetate și trebuie să găsim modelele ascunse din setul de date dat. Deci, pentru a rezolva astfel de cazuri în învățarea automată, avem nevoie de tehnici de învățare nesupravegheată.

Ce este învățarea nesupravegheată?

După cum sugerează și numele, învățarea nesupravegheată este o tehnică de învățare automată în care modelele nu sunt supravegheate folosind un set de date de antrenament. În schimb, modelele în sine găsesc modelele ascunse și perspectivele din datele date. Poate fi comparată cu învățarea care are loc în creierul uman în timp ce se învață lucruri noi. Poate fi definit ca:

ce este gruparea
Învățarea nesupravegheată este un tip de învățare automată în care modelele sunt antrenate folosind un set de date neetichetat și li se permite să acționeze asupra datelor respective fără nicio supraveghere.

Învățarea nesupravegheată nu poate fi aplicată direct unei probleme de regresie sau clasificare deoarece, spre deosebire de învățarea supravegheată, avem datele de intrare, dar nu avem date de ieșire corespunzătoare. Scopul învățării nesupravegheate este de a găsiți structura de bază a setului de date, grupați acele date în funcție de asemănări și reprezentați acel set de date într-un format comprimat .

Exemplu: Să presupunem că algoritmului de învățare nesupravegheat i se oferă un set de date de intrare care conține imagini ale diferitelor tipuri de pisici și câini. Algoritmul nu este niciodată antrenat pe setul de date dat, ceea ce înseamnă că nu are nicio idee despre caracteristicile setului de date. Sarcina algoritmului de învățare nesupravegheată este de a identifica caracteristicile imaginii pe cont propriu. Algoritmul de învățare nesupravegheat va îndeplini această sarcină prin gruparea setului de date de imagine în grupuri în funcție de asemănările dintre imagini.

Învățare automată supravegheată

De ce să folosiți învățarea nesupravegheată?

Mai jos sunt câteva motive principale care descriu importanța învățării nesupravegheate:

  • Învățarea nesupravegheată este utilă pentru a găsi informații utile din date.
  • Învățarea nesupravegheată este mult asemănătoare cu cât un om învață să gândească prin propriile experiențe, ceea ce o face mai aproape de IA reală.
  • Învățarea nesupravegheată funcționează pe date neetichetate și necategorizate, ceea ce face ca învățarea nesupravegheată să fie mai importantă.
  • În lumea reală, nu avem întotdeauna date de intrare cu ieșirea corespunzătoare, așa că pentru a rezolva astfel de cazuri, avem nevoie de învățare nesupravegheată.

Funcționarea învățării nesupravegheate

Funcționarea învățării nesupravegheate poate fi înțeleasă prin diagrama de mai jos:

Învățare automată supravegheată

Aici, am luat date de intrare neetichetate, ceea ce înseamnă că nu este clasificată și nici ieșirile corespunzătoare nu sunt date. Acum, aceste date de intrare neetichetate sunt transmise modelului de învățare automată pentru a-l antrena. În primul rând, va interpreta datele brute pentru a găsi modelele ascunse din date și apoi va aplica algoritmi adecvați, cum ar fi gruparea k-means, arborele de decizie etc.

Odată ce aplică algoritmul potrivit, algoritmul împarte obiectele de date în grupuri în funcție de asemănările și diferența dintre obiecte.

chmod 755

Tipuri de algoritm de învățare nesupravegheat:

Algoritmul de învățare nesupravegheată poate fi clasificat în două tipuri de probleme:

Învățare automată supravegheată
    Clustering: Clustering este o metodă de grupare a obiectelor în grupuri, astfel încât obiectele cu cele mai multe asemănări să rămână într-un grup și să aibă mai puține sau deloc asemănări cu obiectele altui grup. Analiza cluster găsește punctele comune dintre obiectele de date și le clasifică în funcție de prezența și absența acelor elemente comune.Asociere: O regulă de asociere este o metodă de învățare nesupravegheată care este utilizată pentru găsirea relațiilor dintre variabilele din baza de date mare. Determină setul de elemente care apar împreună în setul de date. Regula de asociere face strategia de marketing mai eficientă. De exemplu, oamenii care cumpără un articol X (să presupunem că o pâine) au tendința de a cumpăra și un articol Y (unt/gem). Un exemplu tipic de regulă de asociere este analiza coșului de piață.

Notă: Vom învăța acești algoritmi în capitolele ulterioare.

Algoritmi de învățare nesupravegheată:

Mai jos este lista unor algoritmi populari de învățare nesupravegheată:

    K înseamnă grupare KNN (k-cei mai apropiați vecini) Agruparea ierarhică Detectarea anomaliilor Rețele neuronale Analiza componentelor principale Analiza independentă a componentelor Algoritmul apriori Descompunerea unei valori singulare

Avantajele învățării nesupravegheate

  • Învățarea nesupravegheată este utilizată pentru sarcini mai complexe în comparație cu învățarea supravegheată, deoarece, în învățarea nesupravegheată, nu avem date de intrare etichetate.
  • Învățarea nesupravegheată este de preferat, deoarece este ușor să obțineți date neetichetate în comparație cu datele etichetate.

Dezavantajele învățării nesupravegheate

  • Învățarea nesupravegheată este intrinsec mai dificilă decât învățarea supravegheată, deoarece nu are rezultate corespunzătoare.
  • Rezultatul algoritmului de învățare nesupravegheat ar putea fi mai puțin precis, deoarece datele de intrare nu sunt etichetate, iar algoritmii nu cunosc rezultatul exact în avans.