logo

Tipuri de învățare automată

Învățarea automată este un subset al AI, care permite mașinii să învețe automat din date, să îmbunătățească performanța din experiențele anterioare și să facă predicții . Învățarea automată conține un set de algoritmi care funcționează pe o cantitate imensă de date. Datele sunt transmise acestor algoritmi pentru a-i antrena, iar pe baza antrenamentului, ei construiesc modelul și efectuează o anumită sarcină.

Tipuri de învățare automată

Acești algoritmi ML ajută la rezolvarea diferitelor probleme de afaceri, cum ar fi regresia, clasificarea, prognoza, gruparea și asocierile etc.

Pe baza metodelor și modului de învățare, învățarea automată este împărțită în principal în patru tipuri, care sunt:

  1. Învățare automată supravegheată
  2. Învățare automată nesupravegheată
  3. Învățare automată semi-supervizată
  4. Consolidarea învățării
Tipuri de învățare automată

În acest subiect, vom oferi o descriere detaliată a tipurilor de învățare automată împreună cu algoritmii respectivi:

1. Învățare automată supravegheată

După cum sugerează și numele, Învățare automată supravegheată se bazează pe supraveghere. Înseamnă că, în tehnica de învățare supravegheată, antrenăm mașinile folosind setul de date „etichetat”, iar pe baza antrenamentului, mașina prezice rezultatul. Aici, datele etichetate specifică faptul că unele dintre intrări sunt deja mapate la ieșire. Mai prețios, putem spune; mai întâi, antrenăm mașina cu intrarea și ieșirea corespunzătoare și apoi îi cerem mașinii să prezică rezultatul utilizând setul de date de testare.

Să înțelegem învățarea supravegheată cu un exemplu. Să presupunem că avem un set de date de intrare de imagini de pisici și câini. Deci, mai întâi, vom oferi mașinii instruirea pentru a înțelege imaginile, cum ar fi forma și dimensiunea cozii pisicii și câinelui, forma ochilor, culoarea, înălțimea (câinii sunt mai înalți, pisicile sunt mai mici), etc. După terminarea antrenamentului, introducem imaginea unei pisici și cerem mașinii să identifice obiectul și să prezică rezultatul. Acum, mașina este bine antrenată, așa că va verifica toate caracteristicile obiectului, cum ar fi înălțimea, forma, culoarea, ochii, urechile, coada etc. și va descoperi că este o pisică. Deci, o va pune în categoria Pisici. Acesta este procesul prin care aparatul identifică obiectele în Învățare supravegheată.

Scopul principal al tehnicii de învățare supravegheată este de a mapa variabila de intrare (x) cu variabila de ieșire (y). Unele aplicații din lumea reală ale învățării supravegheate sunt Evaluarea riscurilor, detectarea fraudelor, filtrarea spam-ului, etc.

Categorii de învățare automată supravegheată

Învățarea automată supravegheată poate fi clasificată în două tipuri de probleme, care sunt prezentate mai jos:

ce este exportul în linux
    Clasificare Regresia

a) Clasificare

Algoritmii de clasificare sunt utilizați pentru a rezolva problemele de clasificare în care variabila de ieșire este categorică, cum ar fi „ Da sau Nu, bărbat sau femeie, roșu sau albastru etc . Algoritmii de clasificare prezic categoriile prezente în setul de date. Câteva exemple din lumea reală de algoritmi de clasificare sunt Detectarea spamului, filtrarea e-mailurilor etc.

Câțiva algoritmi de clasificare populari sunt prezentați mai jos:

    Algoritmul pădurii aleatoriu Algoritmul arborelui de decizie Algoritmul de regresie logistică Suportă algoritmul mașinii vectoriale

b) Regresia

Algoritmii de regresie sunt utilizați pentru a rezolva probleme de regresie în care există o relație liniară între variabilele de intrare și de ieșire. Acestea sunt folosite pentru a prezice variabile de ieșire continue, cum ar fi tendințele pieței, prognoza vremii etc.

arhitectura von neumann

Câțiva algoritmi de regresie populari sunt prezentați mai jos:

    Algoritm de regresie liniară simplă Algoritm de regresie multivariată Algoritmul arborelui de decizie Regresia Lasso

Avantajele și dezavantajele învățării supravegheate

Avantaje:

  • Deoarece învățarea supravegheată funcționează cu setul de date etichetat, astfel încât să putem avea o idee exactă despre clasele de obiecte.
  • Acești algoritmi sunt de ajutor în prezicerea rezultatelor pe baza experienței anterioare.

Dezavantaje:

  • Acești algoritmi nu sunt capabili să rezolve sarcini complexe.
  • Poate prezice rezultatul greșit dacă datele de testare sunt diferite de datele de antrenament.
  • Este nevoie de mult timp de calcul pentru a antrena algoritmul.

Aplicații ale învățării supravegheate

Câteva aplicații comune ale învățării supravegheate sunt prezentate mai jos:

    Segmentarea imaginii:
    Algoritmii de învățare supravegheată sunt utilizați în segmentarea imaginilor. În acest proces, clasificarea imaginilor este efectuată pe diferite date de imagine cu etichete predefinite.Diagnostic medical:
    Algoritmii supravegheați sunt utilizați și în domeniul medical în scopuri de diagnostic. Se realizează prin utilizarea imaginilor medicale și a datelor trecute etichetate cu etichete pentru afecțiunile bolii. Cu un astfel de proces, aparatul poate identifica o boală pentru noii pacienți.Detectarea fraudelor -Algoritmii de clasificare a învățării supravegheate sunt utilizați pentru identificarea tranzacțiilor frauduloase, a clienților fraudă etc. Se realizează prin utilizarea datelor istorice pentru a identifica tiparele care pot duce la o posibilă fraudă.Detectare spam -În detectarea și filtrarea spam-ului, se folosesc algoritmi de clasificare. Acești algoritmi clasifică un e-mail ca spam sau nu ca spam. E-mailurile de spam sunt trimise în folderul de spam.Recunoaștere a vorbirii -Algoritmii de învățare supravegheată sunt utilizați și în recunoașterea vorbirii. Algoritmul este antrenat cu date vocale și se pot face diverse identificări folosind aceleași, cum ar fi parole activate prin voce, comenzi vocale etc.

2. Învățare automată nesupravegheată

Învățare nesupravegheată g este diferită de tehnica de învățare supervizată; după cum sugerează și numele, nu este nevoie de supraveghere. Înseamnă, în învățarea automată nesupravegheată, mașina este antrenată folosind setul de date neetichetat, iar mașina prezice rezultatul fără nicio supraveghere.

În învățarea nesupravegheată, modelele sunt antrenate cu date care nu sunt nici clasificate, nici etichetate, iar modelul acționează asupra acestor date fără nicio supraveghere.

Scopul principal al algoritmului de învățare nesupravegheată este gruparea sau categoriile setului de date nesortat în funcție de asemănări, modele și diferențe. Mașinile sunt instruite să găsească modelele ascunse din setul de date de intrare.

Să luăm un exemplu pentru a-l înțelege mai prețios; să presupunem că există un coș de imagini cu fructe și îl introducem în modelul de învățare automată. Imaginile sunt total necunoscute modelului, iar sarcina mașinii este să găsească modelele și categoriile obiectelor.

Deci, acum aparatul își va descoperi modelele și diferențele, cum ar fi diferența de culoare, diferența de formă și va prezice rezultatul atunci când este testat cu setul de date de testare.

Categorii de învățare automată nesupravegheată

Învățarea nesupravegheată poate fi clasificată în două tipuri, care sunt prezentate mai jos:

    Clustering Asociere

1) Clustering

Tehnica de grupare este utilizată atunci când dorim să găsim grupurile inerente din date. Este o modalitate de a grupa obiectele într-un grup, astfel încât obiectele cu cele mai multe asemănări să rămână într-un grup și să aibă mai puține sau deloc asemănări cu obiectele altor grupuri. Un exemplu de algoritm de grupare este gruparea clienților după comportamentul lor de cumpărare.

Unii dintre algoritmii de clustering populari sunt prezentați mai jos:

recursiunea în java
    Algoritmul K-Means Clustering Algoritmul de schimbare medie Algoritmul DBSCAN Analiza componentelor principale Analiza independentă a componentelor

2) Asociere

Învățarea regulilor de asociere este o tehnică de învățare nesupravegheată, care găsește relații interesante între variabilele dintr-un set mare de date. Scopul principal al acestui algoritm de învățare este de a găsi dependența unui element de date de un alt element de date și de a mapa acele variabile în consecință, astfel încât să poată genera profit maxim. Acest algoritm este aplicat în principal în Analiza coșului de piață, extragerea utilizării web, producție continuă , etc.

Unii algoritmi populari de învățare a regulilor de asociere sunt Algoritmul Apriori, Eclat, algoritmul FP-growth.

Avantajele și dezavantajele algoritmului de învățare nesupravegheată

Avantaje:

  • Acești algoritmi pot fi utilizați pentru sarcini complicate în comparație cu cele supravegheate, deoarece acești algoritmi funcționează pe setul de date neetichetat.
  • Algoritmii nesupravegheați sunt preferați pentru diverse sarcini, deoarece obținerea setului de date neetichetat este mai ușoară în comparație cu setul de date etichetat.

Dezavantaje:

  • Ieșirea unui algoritm nesupravegheat poate fi mai puțin precisă, deoarece setul de date nu este etichetat, iar algoritmii nu sunt antrenați cu rezultatul exact anterior.
  • Lucrul cu învățarea nesupravegheată este mai dificil, deoarece funcționează cu setul de date neetichetat care nu se mapează cu rezultatul.

Aplicații ale învățării nesupravegheate

    Analiza rețelei:Învățarea nesupravegheată este utilizată pentru identificarea plagiatului și a drepturilor de autor în analiza rețelei de documente a datelor text pentru articolele academice.Sisteme de recomandare:Sistemele de recomandare folosesc pe scară largă tehnici de învățare nesupravegheată pentru a construi aplicații de recomandare pentru diferite aplicații web și site-uri web de comerț electronic.Detectarea anomaliilor:Detectarea anomaliilor este o aplicație populară a învățării nesupravegheate, care poate identifica puncte de date neobișnuite în setul de date. Este folosit pentru a descoperi tranzacții frauduloase.Descompunerea unei valori singulare:Singular Value Decomposition sau SVD este folosit pentru a extrage anumite informații din baza de date. De exemplu, extragerea de informații despre fiecare utilizator situat într-o anumită locație.

3. Învățare semi-supravegheată

Învățarea semi-supravegheată este un tip de algoritm de învățare automată care se află între învățarea automată supravegheată și nesupravegheată . Reprezintă terenul intermediar între algoritmii de învățare supravegheată (cu date de antrenament etichetate) și de învățare nesupravegheată (fără date de antrenament etichetate) și utilizează combinația de seturi de date etichetate și neetichetate în timpul perioadei de antrenament.

A Deși învățarea semi-supravegheată este calea de mijloc între învățarea supravegheată și nesupravegheată și operează pe date care constau din câteva etichete, aceasta constă în mare parte din date neetichetate. Deoarece etichetele sunt costisitoare, dar în scopuri corporative, acestea pot avea puține etichete. Este complet diferită de învățarea supravegheată și nesupravegheată, deoarece se bazează pe prezența și absența etichetelor.

Pentru a depăși dezavantajele învățării supravegheate și ale algoritmilor de învățare nesupravegheată, este introdus conceptul de învățare semi-supravegheată. . Scopul principal al învățării semi-supravegheate este de a utiliza în mod eficient toate datele disponibile, mai degrabă decât numai datele etichetate ca în învățarea supervizată. Inițial, date similare sunt grupate împreună cu un algoritm de învățare nesupravegheat și, în continuare, ajută la etichetarea datelor neetichetate în date etichetate. Se datorează faptului că datele etichetate sunt o achiziție comparativ mai costisitoare decât datele neetichetate.

Ne putem imagina acești algoritmi cu un exemplu. Învățarea supravegheată este cazul în care un student se află sub supravegherea unui instructor acasă și la facultate. În plus, dacă acel student își auto-analizează același concept fără nici un ajutor din partea instructorului, acesta intră sub învățarea nesupravegheată. În cadrul învățării semi-supravegheate, studentul trebuie să se revizuiască după ce a analizat același concept sub îndrumarea unui instructor la facultate.

aliniați imaginea cu css

Avantajele și dezavantajele învățării semi-supervizate

Avantaje:

  • Este simplu și ușor de înțeles algoritmul.
  • Este foarte eficient.
  • Este folosit pentru a rezolva dezavantajele algoritmilor de învățare supravegheată și nesupravegheată.

Dezavantaje:

  • Rezultatele iterațiilor pot să nu fie stabile.
  • Nu putem aplica acești algoritmi datelor la nivel de rețea.
  • Precizia este scăzută.

4. Învățare prin întărire

Învățarea prin consolidare funcționează pe un proces bazat pe feedback, în care un agent AI (O componentă software) explorează automat împrejurimile sale, lovind și urmăresc, acționând, învățând din experiențe și îmbunătățindu-și performanța. Agentul este recompensat pentru fiecare acțiune bună și este pedepsit pentru fiecare acțiune rea; prin urmare, scopul agentului de învățare prin întărire este de a maximiza recompensele.

vindeca instrument gimp

În învățarea prin consolidare, nu există date etichetate precum învățarea supravegheată, iar agenții învață doar din experiențele lor.

Procesul de învățare prin întărire este similar cu o ființă umană; de exemplu, un copil învață diverse lucruri prin experiențele din viața de zi cu zi. Un exemplu de învățare prin întărire este să joci un joc, în care Jocul este mediul, mișcările unui agent la fiecare pas definesc stări, iar scopul agentului este să obțină un scor mare. Agentul primește feedback în ceea ce privește pedeapsa și recompensele.

Datorită modului său de lucru, învățarea prin întărire este folosită în diferite domenii precum Teoria jocurilor, Cercetarea operațională, Teoria informației, sisteme multi-agent.

O problemă de învățare prin întărire poate fi formalizată folosind Procesul de decizie Markov (MDP). În MDP, agentul interacționează constant cu mediul și realizează acțiuni; la fiecare actiune, mediul raspunde si genereaza o noua stare.

Categorii de învățare prin întărire

Învățarea prin întărire este clasificată în principal în două tipuri de metode/algoritmi:

    Învățare prin întărire pozitivă:Învățarea prin întărire pozitivă specifică creșterea tendinței ca comportamentul cerut să apară din nou prin adăugarea a ceva. Îmbunătățește puterea comportamentului agentului și îl are un impact pozitiv.Învățare prin întărire negativă:Învățarea prin întărire negativă funcționează exact opusă RL pozitivă. Crește tendința ca comportamentul specific să apară din nou prin evitarea condiției negative.

Cazuri de utilizare în lumea reală a învățării prin întărire

    Jocuri video:
    Algoritmii RL sunt foarte populari în aplicațiile de jocuri. Este folosit pentru a obține performanțe supraumane. Unele jocuri populare care folosesc algoritmi RL sunt AlphaGO și AlphaGO Zero .Managementul resurselor:
    Lucrarea „Gestionarea resurselor cu învățare prin consolidare profundă” a arătat că cum să utilizați RL în computer pentru a învăța automat și a programa resursele pentru a aștepta diferite lucrări, pentru a minimiza încetinirea medie a sarcinilor.Robotica:
    RL este utilizat pe scară largă în aplicațiile de robotică. Roboții sunt folosiți în zona industrială și de producție, iar acești roboți devin mai puternici prin învățare prin întărire. Există diferite industrii care au viziunea lor de a construi roboți inteligenți folosind AI și tehnologia de învățare automată.Text Mining
    Text-mining, una dintre marile aplicații ale NLP, este acum implementată cu ajutorul Reinforcement Learning de la compania Salesforce.

Avantajele și dezavantajele învățării prin întărire

Avantaje

  • Ajută la rezolvarea unor probleme complexe din lumea reală, care sunt dificil de rezolvat prin tehnici generale.
  • Modelul de învățare al RL este similar cu învățarea ființelor umane; prin urmare, pot fi găsite cele mai precise rezultate.
  • Ajută la obținerea rezultatelor pe termen lung.

Dezavantaj

  • Algoritmii RL nu sunt preferați pentru probleme simple.
  • Algoritmii RL necesită date și calcule uriașe.
  • Prea multă învățare prin întărire poate duce la o supraîncărcare a stărilor care poate slăbi rezultatele.

Blestemul dimensionalității limitează învățarea prin întărire pentru sistemele fizice reale.