logo

Regresia vs. Clasificare în Machine Learning

Algoritmii de regresie și clasificare sunt algoritmi de învățare supravegheată. Ambii algoritmi sunt utilizați pentru predicție în învățarea automată și funcționează cu seturile de date etichetate. Dar diferența dintre ambele este modul în care sunt utilizate pentru diferite probleme de învățare automată.

Principala diferență dintre algoritmii de regresie și clasificare la care sunt obișnuiți algoritmii de regresie prezice continuul valori precum prețul, salariul, vârsta etc. și algoritmii de clasificare sunt folosiți prezice/Clasifica valorile discrete precum Bărbat sau Femeie, Adevărat sau Fals, Spam sau Nu Spam etc.

Luați în considerare diagrama de mai jos:

Regresie vs. Clasificare

Clasificare:

Clasificarea este un proces de găsire a unei funcții care ajută la împărțirea setului de date în clase bazate pe diferiți parametri. În Clasificare, un program de calculator este antrenat pe setul de date de antrenament și, pe baza acelui antrenament, clasifică datele în diferite clase.

Sarcina algoritmului de clasificare este de a găsi funcția de mapare pentru a mapa intrarea (x) la ieșirea discretă (y).

Exemplu: Cel mai bun exemplu pentru a înțelege problema de clasificare este Detectarea spamului prin e-mail. Modelul este antrenat pe baza a milioane de e-mailuri pe diferiți parametri, iar ori de câte ori primește un nou e-mail, identifică dacă e-mailul este sau nu spam. Dacă e-mailul este spam, atunci este mutat în dosarul Spam.

Tipuri de algoritmi de clasificare ML:

Algoritmii de clasificare pot fi împărțiți în continuare în următoarele tipuri:

  • Regresie logistică
  • K-Cei mai apropiati vecini
  • Suport mașini vectoriale
  • Kernel SVM
  • Nave Bayes
  • Clasificarea arborelui de decizie
  • Clasificarea aleatorie a pădurilor

Regresie:

Regresia este un proces de găsire a corelațiilor dintre variabilele dependente și cele independente. Ajută la prezicerea variabilelor continue, cum ar fi predicția de Tendințele pieței , predicția prețurilor caselor etc.

Sarcina algoritmului de regresie este de a găsi funcția de mapare pentru a mapa variabila de intrare (x) la variabila de ieșire continuă (y).

Exemplu: Să presupunem că vrem să facem prognoza meteo, așa că pentru aceasta, vom folosi algoritmul de regresie. În predicția vremii, modelul este antrenat pe datele din trecut și, odată ce antrenamentul este finalizat, poate prezice cu ușurință vremea pentru zilele viitoare.

Tipuri de algoritm de regresie:

  • Regresia liniară simplă
  • Regresia liniară multiplă
  • Regresia polinomială
  • Sprijină regresia vectorială
  • Regresia arborelui de decizie
  • Regresie aleatorie a pădurii

Diferența dintre regresie și clasificare

Algoritmul de regresie Algoritm de clasificare
În regresie, variabila de ieșire trebuie să fie de natură continuă sau valoare reală. În Clasificare, variabila de ieșire trebuie să fie o valoare discretă.
Sarcina algoritmului de regresie este de a mapa valoarea de intrare (x) cu variabila de ieșire continuă (y). Sarcina algoritmului de clasificare este de a mapa valoarea de intrare (x) cu variabila de ieșire discretă (y).
Algoritmii de regresie sunt utilizați cu date continue. Algoritmii de clasificare sunt utilizați cu date discrete.
În regresie, încercăm să găsim cea mai bună linie de potrivire, care poate prezice rezultatul mai precis. În Clasificare, încercăm să găsim granița de decizie, care poate împărți setul de date în diferite clase.
Algoritmii de regresie pot fi utilizați pentru a rezolva problemele de regresie, cum ar fi predicția vremii, predicția prețului casei etc. Algoritmii de clasificare pot fi utilizați pentru a rezolva probleme de clasificare precum Identificarea e-mailurilor spam, Recunoașterea vorbirii, Identificarea celulelor canceroase etc.
Algoritmul de regresie poate fi împărțit în continuare în regresie liniară și neliniară. Algoritmii de clasificare pot fi împărțiți în clasificator binar și clasificator cu mai multe clase.