Învățarea supravegheată este tipurile de învățare automată în care mașinile sunt antrenate folosind date de antrenament bine „etichetate” și, pe baza acestor date, mașinile prezic rezultatul. Datele etichetate înseamnă că unele date de intrare sunt deja etichetate cu ieșirea corectă.
În învățarea supravegheată, datele de instruire furnizate mașinilor funcționează ca supervizor care învață mașinile să prezică corect rezultatul. Se aplică același concept pe care îl învață un elev sub supravegherea profesorului.
Învățarea supravegheată este un proces de furnizare a datelor de intrare, precum și a datelor de ieșire corecte modelului de învățare automată. Scopul unui algoritm de învățare supravegheată este de a găsiți o funcție de mapare pentru a mapa variabila de intrare (x) cu variabila de ieșire (y) .
În lumea reală, învățarea supravegheată poate fi folosită pentru Evaluarea riscurilor, clasificarea imaginilor, detectarea fraudelor, filtrarea spam-ului , etc.
Cum funcționează învățarea supravegheată?
În învățarea supravegheată, modelele sunt antrenate folosind un set de date etichetat, unde modelul învață despre fiecare tip de date. Odată ce procesul de instruire este finalizat, modelul este testat pe baza datelor de testare (un subset al setului de antrenament) și apoi prezice rezultatul.
Funcționarea învățării supravegheate poate fi ușor de înțeles prin exemplul și diagrama de mai jos:
Să presupunem că avem un set de date de diferite tipuri de forme, care include pătrat, dreptunghi, triunghi și poligon. Acum, primul pas este că trebuie să antrenăm modelul pentru fiecare formă.
apurva padgaonkar
- Dacă forma dată are patru laturi și toate laturile sunt egale, atunci va fi etichetată ca a Pătrat .
- Dacă forma dată are trei laturi, atunci va fi etichetată ca a triunghi .
- Dacă forma dată are șase laturi egale, atunci va fi etichetată ca hexagon .
Acum, după antrenament, ne testăm modelul folosind setul de testare, iar sarcina modelului este să identifice forma.
Mașina este deja instruită pe toate tipurile de forme și, atunci când găsește o nouă formă, clasifică forma pe baza unui număr de laturi și prezice rezultatul.
Pași implicați în învățarea supravegheată:
- Mai întâi, determinați tipul setului de date de antrenament
- Colectați/Adunați datele de antrenament etichetate.
- Împărțiți setul de date de antrenament în antrenament setul de date, setul de date de testare și setul de date de validare .
- Determinați caracteristicile de intrare ale setului de date de antrenament, care ar trebui să aibă suficiente cunoștințe pentru ca modelul să poată prezice cu exactitate rezultatul.
- Determinați algoritmul potrivit pentru model, cum ar fi mașina vector suport, arborele de decizie etc.
- Executați algoritmul pe setul de date de antrenament. Uneori avem nevoie de seturi de validare ca parametri de control, care sunt subseturile de seturi de date de antrenament.
- Evaluați acuratețea modelului furnizând setul de testare. Dacă modelul prezice rezultatul corect, ceea ce înseamnă că modelul nostru este corect.
Tipuri de algoritmi de învățare automată supravegheați:
Învățarea supravegheată poate fi împărțită în două tipuri de probleme:
1. Regresia
Algoritmii de regresie sunt utilizați dacă există o relație între variabila de intrare și variabila de ieșire. Este folosit pentru predicția variabilelor continue, cum ar fi prognoza meteo, tendințele pieței etc. Mai jos sunt câțiva algoritmi de regresie populari care fac obiectul învățării supravegheate:
dacă prin rezumatul rudyard kipling
- Regresie liniara
- Arbori de regresie
- Regresia neliniară
- Regresia liniară bayesiană
- Regresia polinomială
2. Clasificare
Algoritmii de clasificare sunt utilizați atunci când variabila de ieșire este categorică, ceea ce înseamnă că există două clase, cum ar fi Da-Nu, Bărbat-Femeie, Adevărat-fals etc.
filtrare spam,
- Pădurea aleatorie
- Arbori de decizie
- Regresie logistică
- Suport mașini vectoriale
Notă: Vom discuta acești algoritmi în detaliu în capitolele următoare.
Avantajele învățării supravegheate:
- Cu ajutorul învățării supravegheate, modelul poate prezice rezultatul pe baza experiențelor anterioare.
- În învățarea supervizată, putem avea o idee exactă despre clasele de obiecte.
- Modelul de învățare supravegheată ne ajută să rezolvăm diverse probleme din lumea reală, cum ar fi detectarea fraudelor, filtrarea spam-ului , etc.
Dezavantajele învățării supravegheate:
- Modelele de învățare supravegheată nu sunt potrivite pentru gestionarea sarcinilor complexe.
- Învățarea supravegheată nu poate prezice rezultatul corect dacă datele de testare sunt diferite de setul de date de antrenament.
- Antrenamentul a necesitat o mulțime de timpi de calcul.
- În învățarea supravegheată, avem nevoie de suficiente cunoștințe despre clasele de obiecte.