Regresia liniară și regresia logistică sunt cei doi algoritmi faimoși de învățare automată care fac parte din tehnica de învățare supravegheată. Deoarece ambii algoritmi sunt de natură supravegheată, acești algoritmi folosesc un set de date etichetat pentru a face predicții. Dar principala diferență dintre ele este modul în care sunt folosite. Regresia liniară este folosită pentru rezolvarea problemelor de regresie, în timp ce regresia logistică este folosită pentru rezolvarea problemelor de clasificare. Descrierea ambilor algoritmi este dată mai jos împreună cu tabelul de diferențe.
Regresie liniara:
- Regresia liniară este unul dintre cele mai simple algoritmi de învățare automată care face parte din tehnica de învățare supravegheată și este utilizat pentru rezolvarea problemelor de regresie.
- Este folosit pentru prezicerea variabilei dependente continue cu ajutorul variabilelor independente.
- Scopul regresiei liniare este de a găsi cea mai bună linie de potrivire care poate prezice cu exactitate rezultatul pentru variabila dependentă continuă.
- Dacă o singură variabilă independentă este utilizată pentru predicție, atunci se numește regresie liniară simplă, iar dacă există mai mult de două variabile independente, o astfel de regresie se numește regresie liniară multiplă.
- Găsind cea mai bună linie de potrivire, algoritmul stabilește relația dintre variabila dependentă și variabila independentă. Și relația ar trebui să fie de natură liniară.
- Rezultatul pentru regresia liniară ar trebui să fie numai valorile continue, cum ar fi prețul, vârsta, salariul etc. Relația dintre variabila dependentă și variabila independentă poate fi afișată în imaginea de mai jos:
În imaginea de mai sus, variabila dependentă este pe axa Y (salariu), iar variabila independentă este pe axa x (experiență). Linia de regresie poate fi scrisă astfel:
y= a<sub>0</sub>+a<sub>1</sub>x+ ε
Unde un0si a1sunt coeficienții și ε este termenul de eroare.
Regresie logistică:
- Regresia logistică este unul dintre cele mai populare algoritmi de învățare automată care face parte din tehnicile de învățare supravegheată.
- Poate fi folosit atât pentru probleme de clasificare, cât și pentru probleme de regresie, dar folosit în principal pentru probleme de clasificare.
- Regresia logistică este utilizată pentru a prezice variabila dependentă categorială cu ajutorul variabilelor independente.
- Rezultatul problemei de regresie logistică poate fi doar între 0 și 1.
- Regresia logistică poate fi utilizată acolo unde sunt necesare probabilitățile între două clase. Cum ar fi dacă astăzi va ploua sau nu, fie 0 sau 1, adevărat sau fals etc.
- Regresia logistică se bazează pe conceptul de estimare a maximului probabilitate. Conform acestei estimări, datele observate ar trebui să fie cele mai probabile.
- În regresia logistică, trecem suma ponderată a intrărilor printr-o funcție de activare care poate mapa valori între 0 și 1. O astfel de funcție de activare este cunoscută ca funcția sigmoidă iar curba obtinuta se numeste curba sigmoida sau curba S. Luați în considerare imaginea de mai jos:
- Ecuația pentru regresia logistică este:
Diferența dintre regresia liniară și regresia logistică:
Regresie liniara | Regresie logistică |
---|---|
Regresia liniară este utilizată pentru a prezice variabila dependentă continuă folosind un set dat de variabile independente. | Regresia logistică este utilizată pentru a prezice variabila dependentă categorială folosind un set dat de variabile independente. |
Regresia liniară este folosită pentru rezolvarea problemei de regresie. | Regresia logistică este utilizată pentru rezolvarea problemelor de clasificare. |
În regresia liniară, predicăm valoarea variabilelor continue. | În regresia logistică, predicăm valorile variabilelor categoriale. |
În regresia liniară, găsim linia cea mai potrivită, prin care putem prezice cu ușurință rezultatul. | În Regresia Logistică, găsim curba S după care putem clasifica eșantioanele. |
Metoda de estimare a celor mai mici pătrate este utilizată pentru estimarea preciziei. | Metoda de estimare a probabilității maxime este utilizată pentru estimarea acurateței. |
Ieșirea pentru regresia liniară trebuie să fie o valoare continuă, cum ar fi prețul, vârsta etc. | Ieșirea regresiei logistice trebuie să fie o valoare Categoria, cum ar fi 0 sau 1, Da sau Nu etc. |
În regresia liniară, se cere ca relația dintre variabila dependentă și variabila independentă să fie liniară. | În regresia logistică, nu este necesar să existe relația liniară între variabila dependentă și cea independentă. |
În regresia liniară, poate exista coliniaritate între variabilele independente. | În regresia logistică, nu ar trebui să existe coliniaritate între variabila independentă. |