Învățarea automată este un domeniu al informaticii care oferă computerelor capacitatea de a învăța fără a fi programate în mod explicit. Învățarea supravegheată și învățarea nesupravegheată sunt două tipuri principale de învățare automată .
În învăţare supravegheată , mașina este instruită pe un set de date etichetate, ceea ce înseamnă că datele de intrare sunt asociate cu ieșirea dorită. Mașina învață apoi să prezică ieșirea pentru noi date de intrare. Învățarea supravegheată este adesea folosită pentru sarcini precum clasificarea, regresia și detectarea obiectelor.
În învățarea nesupravegheată, mașina este antrenată pe un set de date neetichetate, ceea ce înseamnă că datele de intrare nu sunt asociate cu ieșirea dorită. Mașina învață apoi să găsească modele și relații în date. Învățarea nesupravegheată este adesea folosită pentru sarcini precum gruparea , reducerea dimensionalității și detectarea anomaliilor.
Ce este învățarea supravegheată?
Învățarea supravegheată este un tip de algoritm de învățare automată care învață din datele etichetate. Datele etichetate sunt date care au fost etichetate cu un răspuns sau o clasificare corectă.
Învățarea supravegheată, după cum indică și numele, are prezența unui supervizor ca profesor. Învățarea supravegheată este atunci când predăm sau antrenăm mașina folosind date bine etichetate. Ceea ce înseamnă că unele date sunt deja etichetate cu răspunsul corect. După aceea, mașina este furnizată cu un nou set de exemple (date), astfel încât algoritmul de învățare supravegheat analizează datele de antrenament (setul de exemple de antrenament) și să producă un rezultat corect din datele etichetate.
De exemplu, un set de date etichetat de imagini cu elefant, cămilă și vacă ar avea fiecare imagine etichetată fie cu Elephant , fie Camelor Cow.

Puncte cheie:
- Învățarea supravegheată implică antrenarea unei mașini din date etichetate.
- Datele etichetate constau din exemple cu răspunsul sau clasificarea corectă.
- Aparatul învață relația dintre intrări (imagini de fructe) și ieșiri (etichete de fructe).
- Mașina instruită poate face apoi predicții asupra datelor noi, neetichetate.
Exemplu:
Să presupunem că aveți un coș cu fructe pe care doriți să îl identificați. Aparatul ar analiza mai întâi imaginea pentru a extrage caracteristici precum forma, culoarea și textura acesteia. Apoi, ar compara aceste caracteristici cu caracteristicile fructelor despre care a învățat deja. Dacă caracteristicile noii imagini sunt cel mai asemănătoare cu cele ale unui măr, aparatul ar prezice că fructul este un măr.
subșir șir
De exemplu , să presupunem că vi se oferă un coș plin cu diferite tipuri de fructe. Acum, primul pas este să antrenați mașina cu toate fructele diferite unul câte unul, astfel:
- Dacă forma obiectului este rotunjită și are o depresiune în partea de sus, este de culoare roșie, atunci acesta va fi etichetat ca - Măr .
- Dacă forma obiectului este un cilindru curbat lung cu culoarea verde-galben, atunci acesta va fi etichetat ca - Banană .
Acum să presupunem că, după instruirea datelor, ați dat un nou fruct separat, spuneți Banana din coș, și ați cerut să-l identificați.
Deoarece mașina a învățat deja lucrurile din datele anterioare și de data aceasta trebuie să o folosească cu înțelepciune. Mai întâi va clasifica fructul cu forma și culoarea sa și va confirma numele fructului ca BANANA și îl va pune în categoria Banane. Astfel, mașina învață lucrurile din datele de antrenament (coșul care conține fructe) și apoi aplică cunoștințele pentru a testa datele (fructe noi).
Tipuri de învățare supravegheată
Învățarea supravegheată este clasificată în două categorii de algoritmi:
- Regresia : O problemă de regresie este atunci când variabila de ieșire este o valoare reală, cum ar fi dolari sau greutate.
- Clasificare : O problemă de clasificare este atunci când variabila de ieșire este o categorie, cum ar fi roșu sau albastru, boală sau nicio boală.
Învățarea supravegheată se ocupă de sau învață cu date etichetate. Aceasta înseamnă că unele date sunt deja etichetate cu răspunsul corect.
1- Regresie
Regresia este un tip de învățare supravegheată care este utilizat pentru a prezice valori continue, cum ar fi prețurile caselor, prețurile acțiunilor sau ratarea clienților. Algoritmii de regresie învață o funcție care mapează de la caracteristicile de intrare la valoarea de ieșire.
Unele comune algoritmi de regresie include:
- Regresie liniara
- Regresia polinomială
- Sprijină regresia mașinii vectoriale
- Regresia arborelui de decizie
- Regresie aleatorie a pădurii
2- Clasificare
Clasificarea este un tip de învățare supravegheată care este utilizat pentru a prezice valori categorice, cum ar fi dacă un client va renunța sau nu, dacă un e-mail este sau nu spam sau dacă o imagine medicală arată sau nu o tumoare. Algoritmii de clasificare învață o funcție care mapează de la caracteristicile de intrare la o distribuție de probabilitate pe clasele de ieșire.
Unele comune algoritmi de clasificare include:
JavaScript global variabil
- Regresie logistică
- Suport mașini vectoriale
- Arbori de decizie
- Păduri aleatorii
- Baye naiv
Evaluarea modelelor de învățare supravegheată
Evaluarea modelelor de învățare supravegheată este un pas important în asigurarea faptului că modelul este corect și generalizabil. Există o serie de diferite metrici care pot fi folosite pentru a evalua modelele de învățare supravegheată, dar unele dintre cele mai comune includ:
Pentru regresie
- Eroare pătratică medie (MSE): MSE măsoară diferența medie pătrată dintre valorile prezise și valorile reale. Valorile mai mici MSE indică o performanță mai bună a modelului.
- Eroare pătratică medie (RMSE): RMSE este rădăcina pătrată a MSE, reprezentând abaterea standard a erorilor de predicție. Similar cu MSE, valorile RMSE mai mici indică o performanță mai bună a modelului.
- Eroare absolută medie (MAE): MAE măsoară diferența absolută medie dintre valorile prezise și valorile reale. Este mai puțin sensibil la valori aberante în comparație cu MSE sau RMSE.
- R-pătrat (coeficient de determinare): R-pătrat măsoară proporția varianței variabilei țintă care este explicată de model. Valorile R-pătrat mai mari indică o potrivire mai bună a modelului.
Pentru Clasificare
- Precizie: Acuratețea este procentul de predicții pe care modelul le face corect. Se calculează împărțind numărul de predicții corecte la numărul total de predicții.
- Precizie: Precizia este procentul de predicții pozitive pe care modelul le face și care sunt de fapt corecte. Se calculează împărțind numărul de pozitive adevărate la numărul total de predicții pozitive.
- Amintiți-vă: Reamintirea este procentul din toate exemplele pozitive pe care modelul le identifică corect. Se calculează împărțind numărul de exemple pozitive adevărate la numărul total de exemple pozitive.
- scor F1: Scorul F1 este o medie ponderată a preciziei și a reamintirii. Se calculează luând media armonică a preciziei și a reamintirii.
- Matricea de confuzie: O matrice de confuzie este un tabel care arată numărul de predicții pentru fiecare clasă, împreună cu etichetele clasei reale. Poate fi folosit pentru a vizualiza performanța modelului și pentru a identifica zonele în care modelul are probleme.
Aplicații ale învățării supravegheate
Învățarea supravegheată poate fi utilizată pentru a rezolva o mare varietate de probleme, inclusiv:
- Filtrarea spamului: Algoritmii de învățare supravegheați pot fi antrenați pentru a identifica și clasifica e-mailurile spam în funcție de conținutul acestora, ajutând utilizatorii să evite mesajele nedorite.
- Clasificarea imaginilor: Învățarea supravegheată poate clasifica automat imaginile în diferite categorii, cum ar fi animale, obiecte sau scene, facilitând sarcini precum căutarea imaginilor, moderarea conținutului și recomandările de produse bazate pe imagini.
- Diagnostic medical: Învățarea supravegheată poate ajuta la diagnosticarea medicală prin analiza datelor despre pacient, cum ar fi imagini medicale, rezultatele testelor și istoricul pacientului, pentru a identifica modele care sugerează anumite boli sau afecțiuni.
- Detectarea fraudei: Modelele de învățare supravegheată pot analiza tranzacțiile financiare și pot identifica modele care indică activități frauduloase, ajutând instituțiile financiare să prevină frauda și să își protejeze clienții.
- Procesarea limbajului natural (NLP): Învățarea supravegheată joacă un rol crucial în sarcinile NLP, inclusiv analiza sentimentelor, traducerea automată și rezumarea textului, permițând mașinilor să înțeleagă și să proceseze limbajul uman în mod eficient.
Avantajele învățării supravegheate
- Învățarea supravegheată permite colectarea datelor și produce date din experiențele anterioare.
- Ajută la optimizarea criteriilor de performanță cu ajutorul experienței.
- Învățarea automată supravegheată ajută la rezolvarea diferitelor tipuri de probleme de calcul din lumea reală.
- Îndeplinește sarcini de clasificare și regresie.
- Permite estimarea sau maparea rezultatului la un eșantion nou.
- Avem control complet asupra alegerii numărului de clase pe care le dorim în datele de instruire.
Dezavantajele învățării supravegheate
- Clasificarea datelor mari poate fi o provocare.
- Instruirea pentru învățarea supravegheată necesită mult timp de calcul. Deci, necesită mult timp.
- Învățarea supravegheată nu poate gestiona toate sarcinile complexe din Machine Learning.
- Timpul de calcul este mare pentru învățarea supravegheată.
- Necesită un set de date etichetat.
- Este nevoie de un proces de instruire.
Ce este învățarea nesupravegheată?
Învățarea nesupravegheată este un tip de învățare automată care învață din date neetichetate. Aceasta înseamnă că datele nu au etichete sau categorii preexistente. Scopul învățării nesupravegheate este de a descoperi modele și relații în date fără nicio îndrumare explicită.
Învățarea nesupravegheată este formarea unei mașini care utilizează informații care nu sunt nici clasificate, nici etichetate și care permite algoritmului să acționeze asupra acelei informații fără îndrumare. Aici sarcina mașinii este de a grupa informațiile nesortate în funcție de asemănări, modele și diferențe, fără nicio pregătire prealabilă a datelor.
Spre deosebire de învățarea supravegheată, nu este oferit niciun profesor, ceea ce înseamnă că nu va fi oferită nicio formare mașinii. Prin urmare, mașina este restricționată să găsească singură structura ascunsă în date neetichetate.
Puteți utiliza învățarea nesupravegheată pentru a examina datele despre animale care au fost adunate și pentru a distinge mai multe grupuri în funcție de trăsăturile și acțiunile animalelor. Aceste grupări pot corespunde diferitelor specii de animale, oferindu-vă să clasificați creaturile fără a depinde de etichetele care există deja.

Puncte cheie
- Învățarea nesupravegheată permite modelului să descopere tipare și relații în date neetichetate.
- Algoritmii de grupare grupează puncte de date similare pe baza caracteristicilor lor inerente.
- Extragerea caracteristicilor captează informații esențiale din date, permițând modelului să facă distincții semnificative.
- Asocierea de etichete atribuie categorii clusterelor pe baza modelelor și caracteristicilor extrase.
Exemplu
Imaginați-vă că aveți un model de învățare automată antrenat pe un set mare de date de imagini neetichetate, care conține atât câini, cât și pisici. Modelul nu a văzut niciodată o imagine a unui câine sau pisică până acum și nu are etichete sau categorii preexistente pentru aceste animale. Sarcina ta este să folosești învățarea nesupravegheată pentru a identifica câinii și pisicile într-o imagine nouă, nevăzută.
conectează java cu mysql
De exemplu , să presupunem că i se oferă o imagine având atât câini, cât și pisici pe care nu le-a văzut niciodată.
Astfel, aparatul nu are idee despre caracteristicile câinilor și pisicilor, așa că nu îl putem clasifica drept „câini și pisici”. Dar le poate clasifica în funcție de asemănările, modelele și diferențele lor, adică putem clasifica cu ușurință imaginea de mai sus în două părți. Prima poate conține toate pozele care au câini în ele și a doua parte poate conține toate pozele care au pisici în ele. Aici nu ai învățat nimic înainte, ceea ce înseamnă că nu ai date de antrenament sau exemple.
Permite modelului să lucreze singur pentru a descoperi tipare și informații care au fost nedetectate anterior. Se ocupă în principal de date neetichetate.
Tipuri de învățare nesupravegheată
Învățarea nesupravegheată este clasificată în două categorii de algoritmi:
ce este rom
- Clustering : O problemă de grupare este locul în care doriți să descoperiți grupările inerente în date, cum ar fi gruparea clienților în funcție de comportamentul de cumpărare.
- Asociere : O problemă de învățare a regulilor de asociere este în cazul în care doriți să descoperiți reguli care descriu porțiuni mari din datele dvs., cum ar fi oamenii care cumpără X tind să cumpere și Y.
Clustering
Clustering este un tip de învățare nesupravegheată care este utilizat pentru a grupa puncte de date similare. Algoritmi de grupare lucrează prin mutarea iterativă a punctelor de date mai aproape de centrele lor de cluster și mai departe de punctele de date din alte clustere.
- Exclusiv (partiționare)
- Aglomerativ
- Suprapune
- Probabilistică
Tipuri de grupare: -
- Gruparea ierarhică
- K înseamnă grupare
- Analiza componentelor principale
- Descompunerea unei valori singulare
- Analiza independentă a componentelor
- Modele de amestec gaussiene (GMM)
- Clustering spațial bazat pe densitate a aplicațiilor cu zgomot (DBSCAN)
Învățarea regulilor de asociere
Învățarea regulilor de asociere este un tip de învățare nesupravegheată care este utilizat pentru a identifica tiparele dintr-o dată. Regula de asociere algoritmii de învățare funcționează prin găsirea de relații între diferite elemente dintr-un set de date.
Unii algoritmi comuni de învățare a regulilor de asociere includ:
- Algoritmul apriori
- Algoritmul Eclat
- Algoritmul FP-Growth
Evaluarea modelelor de învățare nesupravegheată
Evaluarea modelelor de învățare nesupravegheată este un pas important în asigurarea faptului că modelul este eficient și util. Cu toate acestea, poate fi mai dificil decât evaluarea modelelor de învățare supravegheată, deoarece nu există date de bază pentru a compara predicțiile modelului.
Există o serie de metrici diferite care pot fi utilizate pentru a evalua modelele de învățare nesupravegheată, dar unele dintre cele mai comune includ:
- Scorul siluetei: Scorul siluetei măsoară cât de bine este grupat fiecare punct de date cu membrii săi de grup și separat de alte grupuri. Acesta variază de la -1 la 1, cu scoruri mai mari indicând o mai bună grupare.
- Scorul Calinski-Harabasz: Scorul Calinski-Harabasz măsoară raportul dintre varianța dintre clustere și varianța în cadrul clusterelor. Acesta variază de la 0 la infinit, cu scoruri mai mari indicând o mai bună grupare.
- Indicele Rand ajustat: Indicele Rand ajustat măsoară similitudinea dintre două grupări. Acesta variază de la -1 la 1, cu scoruri mai mari indicând grupări mai asemănătoare.
- Indicele Davies-Buldin: Indicele Davies-Buldin măsoară similaritatea medie dintre clustere. Acesta variază de la 0 la infinit, cu scoruri mai mici indicând o mai bună grupare.
- scor F1: Scorul F1 este o medie ponderată a preciziei și a reamintirii, care sunt două metrici care sunt utilizate în mod obișnuit în învățarea supravegheată pentru a evalua modelele de clasificare. Cu toate acestea, scorul F1 poate fi folosit și pentru a evalua modele de învățare nesupravegheate, cum ar fi modelele de grupare.
Aplicație de învăţare nesupravegheată
Învățarea nesupravegheată poate fi utilizată pentru a rezolva o mare varietate de probleme, inclusiv:
- Detectarea anomaliilor: învățarea nesupravegheată poate identifica modele neobișnuite sau abateri de la comportamentul normal în date, permițând detectarea fraudelor, intruziunilor sau defecțiunilor sistemului.
- Descoperire științifică: învățarea nesupravegheată poate descoperi relații și modele ascunse în datele științifice, conducând la noi ipoteze și perspective în diferite domenii științifice.
- Sisteme de recomandare: învățarea nesupravegheată poate identifica modele și asemănări în comportamentul și preferințele utilizatorilor pentru a recomanda produse, filme sau muzică care se aliniază intereselor acestora.
- Segmentarea clienților: învățarea nesupravegheată poate identifica grupuri de clienți cu caracteristici similare, permițând companiilor să vizeze campanii de marketing și să îmbunătățească mai eficient serviciul pentru clienți.
- Analiza imaginilor: Învățarea nesupravegheată poate grupa imagini în funcție de conținutul lor, facilitând sarcini precum clasificarea imaginilor, detectarea obiectelor și recuperarea imaginilor.
Avantaje de învăţare nesupravegheată
- Nu necesită etichetarea datelor de antrenament.
- Reducerea dimensionalității poate fi realizată cu ușurință folosind învățarea nesupravegheată.
- Capabil să găsească modele necunoscute anterior în date.
- Învățarea nesupravegheată vă poate ajuta să obțineți informații din date neetichetate pe care altfel nu le-ați fi putut obține.
- Învățarea nesupravegheată este bună la găsirea de modele și relații în date fără să vi se spună ce să caute. Acest lucru vă poate ajuta să învățați lucruri noi despre datele dvs.
Dezavantaje de învăţare nesupravegheată
- Este dificil de măsurat acuratețea sau eficacitatea din cauza lipsei de răspunsuri predefinite în timpul antrenamentului.
- Rezultatele au adesea o acuratețe mai mică.
- Utilizatorul trebuie să petreacă timp interpretând și etichetând clasele care urmează acea clasificare.
- Învățarea nesupravegheată poate fi sensibilă la calitatea datelor, inclusiv la valorile lipsă, valorile aberante și datele zgomotoase.
- Fără date etichetate, poate fi dificil să se evalueze performanța modelelor de învățare nesupravegheată, ceea ce face dificilă evaluarea eficacității acestora.
Învățare automată supravegheată vs. nesupravegheată
| Parametrii | Învățare automată supravegheată | Învățare automată nesupravegheată |
|---|---|---|
| Date de intrare | Algoritmii sunt antrenați folosind date etichetate. | Algoritmii sunt utilizați împotriva datelor care nu sunt etichetate |
| Complexitatea computațională | Metodă mai simplă | Complex din punct de vedere computațional |
| Precizie | Foarte precis | Mai puțin precis |
| Nr de clase | Numărul de clase este cunoscut | Nu se cunoaște numărul de clase |
| Analiza datelor | Utilizează analiza offline | Utilizează analiza în timp real a datelor |
| Algoritmi utilizați | Regresie liniară și logistică, pădure aleatoare, clasificare multiclasă, arbore de decizie, mașină vectorială de suport, rețea neuronală etc. | Clustering K-Means, clustering ierarhic, KNN, algoritm Apriori etc. |
| Ieșire | Ieșirea dorită este dată. | Ieșirea dorită nu este dată. |
| Date de antrenament | Utilizați datele de antrenament pentru a deduce modelul. | Nu sunt folosite date de antrenament. |
| Model complex | Nu este posibil să înveți modele mai mari și mai complexe decât în cazul învățării supravegheate. | Este posibil să învățați modele mai mari și mai complexe cu învățare nesupravegheată. |
| Model | Putem testa modelul nostru. | Nu putem testa modelul nostru. |
| Numit ca | Învățarea supravegheată se mai numește și clasificare. | Învățarea nesupravegheată se mai numește și grupare. |
| Exemplu | Exemplu: recunoașterea optică a caracterelor. | Exemplu: Găsiți o față într-o imagine. |
| Supraveghere | învățarea supravegheată are nevoie de supraveghere pentru a antrena modelul. | Învățarea nesupravegheată nu are nevoie de nicio supraveghere pentru a antrena modelul. șir în json java |
Concluzie
Învățarea supravegheată și nesupravegheată sunt două instrumente puternice care pot fi folosite pentru a rezolva o mare varietate de probleme. Învățarea supravegheată este potrivită pentru sarcinile în care rezultatul dorit este cunoscut, în timp ce învățarea nesupravegheată este potrivită pentru sarcinile în care rezultatul dorit este necunoscut.
Întrebări frecvente (Întrebări frecvente)
1. Care este diferența dintre limbajul mașină supravegheat și cel nesupravegheat?
Învățarea supravegheată și nesupravegheată sunt două abordări fundamentale ale învățării automate care diferă în ceea ce privește datele de formare și obiectivele de învățare.
- Învățare supravegheată implică antrenarea unui model de învățare automată pe un set de date etichetat, în care fiecare punct de date are o etichetă corespunzătoare sau o valoare de ieșire. Algoritmul învață să mapeze datele de intrare la ieșirea dorită, permițându-i să facă predicții pentru date noi, nevăzute.
- Învățare nesupravegheată , pe de altă parte, se ocupă de seturi de date neetichetate, unde punctele de date nu au etichete asociate sau valori de ieșire.
2. Ce este învățarea supravegheată?
Învățarea supravegheată este un tip de învățare automată în care algoritmul este antrenat pe un set de date etichetat, în care fiecare punct de date are o etichetă corespunzătoare sau o valoare de ieșire. Algoritmul învață să mapeze datele de intrare la ieșirea dorită, permițându-i să facă predicții pentru date noi, nevăzute.
3. Care sunt algoritmii obișnuiți de învățare supravegheată?
Algoritmii obișnuiți de învățare supravegheată includ:
- Clasificare: Folosit pentru a atribui categorii punctelor de date. Exemplele includ mașini vector de suport (SVM), regresie logistică și arbori de decizie.
- Regresie: Folosit pentru a prezice valori numerice continue. Exemplele includ regresia liniară, regresia polinomială și regresia de creastă.
4. Care sunt algoritmii obișnuiți de învățare nesupravegheată?
Algoritmii obișnuiți de învățare nesupravegheată includ:
- Clustering: Gruparea punctelor de date în clustere pe baza asemănării lor. Exemplele includ gruparea k-means și gruparea ierarhică.
- Reducerea dimensionalității: Reducerea numărului de caracteristici dintr-un set de date, păstrând în același timp cele mai importante informații. Exemplele includ analiza componentelor principale (PCA) și codificatoarele automate.
5. Ce este învățarea nesupravegheată?
Învățarea nesupravegheată este un tip de învățare automată în care algoritmul este antrenat pe un set de date neetichetat, unde punctele de date nu au etichete corespunzătoare sau valori de ieșire. Algoritmul învață să identifice modele și structuri în date fără îndrumare explicită.
6. Când să folosiți învățarea supravegheată vs. învățarea nesupravegheată?
Utilizați învățarea supravegheată atunci când aveți un set de date etichetat și doriți să faceți predicții pentru date noi. Utilizați învățarea nesupravegheată atunci când aveți un set de date neetichetat și doriți să identificați modele sau structuri în date.