ALGORITMI DE ÎNVĂȚARE AUTOMATĂ

Algoritmi de învățare automată sunt modele computaționale care permit computerelor să înțeleagă tipare și să prezinte sau să emită judecăți bazate pe date fără a fi nevoie de programare explicită. Acești algoritmi formează baza inteligenței artificiale moderne și sunt utilizați într-o gamă largă de aplicații, inclusiv recunoașterea imaginilor și a vorbirii, procesarea limbajului natural, sisteme de recomandare, detectarea fraudelor, mașini autonome etc.

converti un șir în data

Acest Algoritmi de învățare automată articolul va acoperi toți algoritmii esențiali ai învățării automate, cum ar fi Sprijină mașină vectorială, luare a deciziilor, regresie logistică, clasificator bayees naiv, pădure aleatoare, grupare k-mean, învățare prin consolidare, vector, grupare ierarhică, xgboost, adaboost, logistică etc.

Tipuri de algoritmi de învățare automată

Există trei tipuri de algoritmi de învățare automată.

Învățare supravegheată
- Regresia
- Clasificare
Învățare nesupravegheată
- Clustering
- Reducerea dimensionalității
Consolidarea învățării

Tipuri de algoritmi de învățare automată

1. Algoritm de învățare supravegheată

Învățare supravegheată este un tip de algoritmi de învățare automată în care am folosit un set de date etichetat pentru a antrena modelul sau algoritmii. Scopul algoritmului este de a învăța o mapare de la datele de intrare la etichetele de ieșire, permițându-i să facă predicții sau clasificări pe date noi, nevăzute.

Algoritmi de învățare automată supravegheați
Model liniar: Regresia Regresia obișnuită cu cele mai mici pătrate Regresia liniară simplă Regresia liniară multiplă Regresia polinomială Urmărirea potrivirii ortogonale (OMP) Regresia Bayesiană Regresia cuantilă Regresia izotonică Regresie în trepte Regresie cu cel mai mic unghi (LARS) Clasificare: Regresie logistică Funcții Sigmoid și Softmax Regularizare : Lasso (regularizare L1) Ridge (regularizare L2) Regresia crestei Clasificator Ridge Plasa elastica LARS Lasso K-Cei mai apropiați vecini (KNN): Algoritmi de forță brută Algoritmi pentru arborele bile și arborele KD Clasificator K-Nearest Neighbours (KNN). Regressor K-Nearest Neighbours (KNN). Mașini de suport Vector: Suport Vector Machines Regressor Diferite funcții Kernel în SVM Coborâre a gradientului stocastic Clasificator Stochastic Gradient Descent Regressor de coborâre a gradientului stocastic Diferite funcții de pierdere în SGD Arborele de decizie: Algoritmi de arbore de decizie Algoritmi de dihotomizor iterativ 3 (ID3). C5. Algoritmi Algoritmi pentru arbori de clasificare și regresie Clasificator de arbore de decizie Arborele de decizie Regressor Învățare prin ansamblu: Ambalare (agregare Bootstrap) Pădurea aleatorie Copaci suplimentari Amplificare AdaBoost XGBoost CatBoost Mașini de creștere a gradului (GBM) LightGBM Stivuire Modelul generativ Bayes naiv Bayes naiv gaussian Bayes naiv multinomial Bernoulli Naive Bayes Procese gaussiene Regresia procesului gaussian (GPR) Clasificarea proceselor gaussiene (GPC) Analiza discriminantă Gaussiană Analiza liniară discriminantă (LDA) Analiza cu discriminări pătratice (QDA) Rețele Bayesiene de credință Modele Markov ascunse (HMM) Prognoza serii temporale: Vizualizarea și analiza serii temporale: Componentele seriei temporale: tendință, sezonier și zgomot Tehnici de descompunere a seriilor temporale Ajustarea sezonieră și diferențierea Autocorelare și Funcții de autocorelare parțială Test Dickey-Fuller crescut Descompunerea sezonieră a seriilor temporale (descompunerea STL) Metodologia Box-Jenkins pentru modelele ARIMA Algoritmi de prognoză a serii temporale: Media mobilă (MA) și medie mobilă ponderată Metode de netezire exponențială (simple, duble și triple) Modele autoregresive (AR). Modele cu medie mobilă (MA). Modele Autoregressive Integrate Moving Average (ARIMA). Descompunerea sezonieră a seriilor temporale după Loess (STL) Modele cu medii mobile integrate autoregressive sezoniere (SARIMA). Modelele ARIMAX și SARIMAX Tehnica de reducere a dimensionalității supravegheate: Analiza liniară discriminantă (LDA) Unii dintre algoritmii de învățare automată supravegheați pot fi utilizați atât pentru clasificare, cât și pentru regresie, cu puține modificări Algoritmi multiclasă și multiieșire: Clasificare multiclasă Clasificator OneVsRest Clasificare cu mai multe etichete Regresie cu ieșiri multiple Valori pentru algoritmii de clasificare și regresie: Valori de regresie: Eroare pătratică medie (MSE) Eroare pătratică medie (RMSE) Eroare absolută medie (MAE) R-pătrat R-pătrat ajustat Valori de clasificare: Matricea confuziei Precizie Amintiți-vă Specificitate Scorul F1 Aria sub curba ROC (AUC-ROC) Calibrarea probabilității Curbe de calibrare Calibrarea unui clasificator Tehnica de validare încrucișată: Validare încrucișată K-fold Validare încrucișată stratificată k-fold Validare încrucișată cu excepție Amestecă validarea încrucișată a împărțirii Validare încrucișată a seriilor temporale Tehnica de optimizare: Coborâre în gradient Coborâre a gradientului stocastic Coborâre gradient mini-lot Coborâre în gradient bazată pe impuls Tehnici de optimizare bazate pe Newton algoritmul lui Newton Metode cvasi-Newton (BFGS, L-BFGS) Gradient conjugat Tehnici de optimizare a căutării locale Alpinism Căutare Tabu

Algoritmi de învățare automată supravegheați

Model liniar:
- Regresia
  - Regresia obișnuită cu cele mai mici pătrate
  - Regresia liniară simplă
  - Regresia liniară multiplă
  - Regresia polinomială
  - Urmărirea potrivirii ortogonale (OMP)
  - Regresia Bayesiană
  - Regresia cuantilă
  - Regresia izotonică
  - Regresie în trepte
  - Regresie cu cel mai mic unghi (LARS)
- Clasificare:
  - Regresie logistică
    - Funcții Sigmoid și Softmax
- Regularizare :
  - Lasso (regularizare L1)
  - Ridge (regularizare L2)
    - Regresia crestei
    - Clasificator Ridge
  - Plasa elastica
  - LARS Lasso
K-Cei mai apropiați vecini (KNN):
- Algoritmi de forță brută
- Algoritmi pentru arborele bile și arborele KD
- Clasificator K-Nearest Neighbours (KNN).
- Regressor K-Nearest Neighbours (KNN).
Mașini de suport Vector:
- Suport Vector Machines Regressor
- Diferite funcții Kernel în SVM
Coborâre a gradientului stocastic
- Clasificator Stochastic Gradient Descent
- Regressor de coborâre a gradientului stocastic
- Diferite funcții de pierdere în SGD
Arborele de decizie:
- Algoritmi de arbore de decizie
  - Algoritmi de dihotomizor iterativ 3 (ID3).
  - C5. Algoritmi
  - Algoritmi pentru arbori de clasificare și regresie
- Clasificator de arbore de decizie
- Arborele de decizie Regressor
Învățare prin ansamblu:
- Ambalare (agregare Bootstrap)
  - Pădurea aleatorie
  - Copaci suplimentari
- Amplificare
  - AdaBoost
  - XGBoost
  - CatBoost
  - Mașini de creștere a gradului (GBM)
  - LightGBM
- Stivuire
Modelul generativ
- Bayes naiv
  - Bayes naiv gaussian
  - Bayes naiv multinomial
  - Bernoulli Naive Bayes
- Procese gaussiene
  - Regresia procesului gaussian (GPR)
  - Clasificarea proceselor gaussiene (GPC)
- Analiza discriminantă Gaussiană
  - Analiza liniară discriminantă (LDA)
  - Analiza cu discriminări pătratice (QDA)
- Rețele Bayesiene de credință
- Modele Markov ascunse (HMM)
Prognoza serii temporale:
- Vizualizarea și analiza serii temporale:
  - Componentele seriei temporale: tendință, sezonier și zgomot
  - Tehnici de descompunere a seriilor temporale
  - Ajustarea sezonieră și diferențierea
  - Autocorelare și Funcții de autocorelare parțială
  - Test Dickey-Fuller crescut
  - Descompunerea sezonieră a seriilor temporale (descompunerea STL)
  - Metodologia Box-Jenkins pentru modelele ARIMA
- Algoritmi de prognoză a serii temporale:
  - Media mobilă (MA) și medie mobilă ponderată
  - Metode de netezire exponențială (simple, duble și triple)
  - Modele autoregresive (AR).
  - Modele cu medie mobilă (MA).
  - Modele Autoregressive Integrate Moving Average (ARIMA).
  - Descompunerea sezonieră a seriilor temporale după Loess (STL)
  - Modele cu medii mobile integrate autoregressive sezoniere (SARIMA).
  - Modelele ARIMAX și SARIMAX
Tehnica de reducere a dimensionalității supravegheate:
- Analiza liniară discriminantă (LDA)

Unii dintre algoritmii de învățare automată supravegheați pot fi utilizați atât pentru clasificare, cât și pentru regresie, cu puține modificări

Algoritmi multiclasă și multiieșire:
- Clasificare multiclasă
  - Clasificator OneVsRest
- Clasificare cu mai multe etichete
- Regresie cu ieșiri multiple

Valori pentru algoritmii de clasificare și regresie:

Valori de regresie:
- Eroare pătratică medie (MSE)
- Eroare pătratică medie (RMSE)
- Eroare absolută medie (MAE)
- R-pătrat
- R-pătrat ajustat
Valori de clasificare:
- Matricea confuziei
- Precizie
- Amintiți-vă
- Specificitate
- Scorul F1
- Aria sub curba ROC (AUC-ROC)
Calibrarea probabilității
- Curbe de calibrare
- Calibrarea unui clasificator

Tehnica de validare încrucișată:

Validare încrucișată K-fold
Validare încrucișată stratificată k-fold
Validare încrucișată cu excepție
Amestecă validarea încrucișată a împărțirii
Validare încrucișată a seriilor temporale

Tehnica de optimizare:

Coborâre în gradient
- Coborâre a gradientului stocastic
- Coborâre gradient mini-lot
- Coborâre în gradient bazată pe impuls
Tehnici de optimizare bazate pe Newton
- algoritmul lui Newton
- Metode cvasi-Newton (BFGS, L-BFGS)
- Gradient conjugat
Tehnici de optimizare a căutării locale
- Alpinism
- Căutare Tabu

2. Algoritmul de învățare nesupravegheat

Învățare nesupravegheată este un tip de algoritmi de învățare automată în care algoritmii sunt utilizați pentru a găsi modelele, structura sau relația dintr-un set de date folosind un set de date neetichetat. Acesta explorează structura inerentă a datelor fără categorii sau etichete predefinite.

Algoritmi de învățare automată nesupravegheați tip de returnare în java
Clustering Metode bazate pe centroid K-Means clustering Gruparea K-Means++ Gruparea în modul K Clustering fuzzy C-Means (FCM). Metode bazate pe distribuție Modele de amestec gaussiene (GMM) Algoritmi de așteptare-maximizare Modele de amestec de proces Dirichlet (DPMM) Metode bazate pe conectivitate Gruparea ierarhică Clustering aglomerativ Agruparea divizionară Propagarea afinității Metode bazate pe densitate DBSCAN (Clustering spațial bazat pe densitate a aplicațiilor cu zgomot) OPTICĂ (Puncte de comandă pentru a identifica structura de grupare) Regulă Asociația Minerit Algoritmul apriori FP-Growth (model-creștere frecventă) ECLAT (Clustering Class de echivalență și traversarea rețelei de jos în sus) Detectarea anomaliilor: Scorul Z Factorul Outlier Local (LOF) Pădure de izolare Tehnica de reducere a dimensionalității: Analiza componentelor principale (PCA) Încorporare stocastică de vecinătate cu distribuție t (t-SNE) Factorizarea matricei nenegative (NMF) Analiza independentă a componentelor (ICA) Analiza factorilor Alocarea dirichlet latentă (LDA) Isomap Încorporare liniară locală (LLE) Analiza semantică latentă (LSA)

Algoritmi de învățare automată nesupravegheați

tip de returnare în java

Clustering
- Metode bazate pe centroid
  - K-Means clustering
  - Gruparea K-Means++
  - Gruparea în modul K
  - Clustering fuzzy C-Means (FCM).
- Metode bazate pe distribuție
  - Modele de amestec gaussiene (GMM)
  - Algoritmi de așteptare-maximizare
  - Modele de amestec de proces Dirichlet (DPMM)
- Metode bazate pe conectivitate
  - Gruparea ierarhică
    - Clustering aglomerativ
    - Agruparea divizionară
  - Propagarea afinității
- Metode bazate pe densitate
  - DBSCAN (Clustering spațial bazat pe densitate a aplicațiilor cu zgomot)
  - OPTICĂ (Puncte de comandă pentru a identifica structura de grupare)
Regulă Asociația Minerit
- Algoritmul apriori
- FP-Growth (model-creștere frecventă)
- ECLAT (Clustering Class de echivalență și traversarea rețelei de jos în sus)
Detectarea anomaliilor:
- Scorul Z
- Factorul Outlier Local (LOF)
- Pădure de izolare
Tehnica de reducere a dimensionalității:
- Analiza componentelor principale (PCA)
- Încorporare stocastică de vecinătate cu distribuție t (t-SNE)
- Factorizarea matricei nenegative (NMF)
- Analiza independentă a componentelor (ICA)
- Analiza factorilor
- Alocarea dirichlet latentă (LDA)
- Isomap
- Încorporare liniară locală (LLE)
- Analiza semantică latentă (LSA)

3. Învățare prin întărire

Consolidarea învățării este un tip de algoritmi de învățare automată în care un agent învață să ia decizii succesive interacționând cu mediul înconjurător. Agentul primește feedback-ul sub formă de stimulente sau pedepse pe baza acțiunilor sale. Scopul agentului este de a descoperi tactici optime care maximizează recompensele cumulate în timp prin încercare și eroare. Învățarea prin consolidare este folosită frecvent în scenarii în care agentul trebuie să învețe cum să navigheze într-un mediu, să joace jocuri, să gestioneze roboți sau să emită judecăți în situații incerte.

Consolidarea învățării
Metode bazate pe model: Procesele de decizie Markov (MDP) Ecuația Bellman Algoritm de iterare a valorii Căutarea arborilor din Monte Carlo Metode fără model: Metode bazate pe valoare: Q-Learning SOS Metode Monte Carlo Metode bazate pe politici: Algoritmul REINFORCE Algoritmul actor-critic Metode actor-critice Avantaj asincron actor-critic (A3C)

Lista algoritmilor populari de învățare automată

Iată o listă a celor mai populari 10 algoritmi de învățare automată.

1. Regresia liniară

Regresia liniară este un algoritm simplu utilizat pentru a mapa relația liniară dintre caracteristicile de intrare și o variabilă țintă continuă. Funcționează prin potrivirea unei linii la date și apoi folosind linia pentru a prezice noi valori.

2. Regresia logistică

Regresia logistică este o extensie a regresiei liniare care este utilizată pentru sarcini de clasificare pentru a estima probabilitatea ca o instanță să aparțină unei clase specifice.

3. SVM (Support Vector Machine)

SVM-urile sunt algoritmi de învățare supravegheați care pot efectua sarcini de clasificare și regresie. Găsește un hiperplan care separă cel mai bine clasele în spațiul caracteristic.

4. KNN (K-cel mai apropiat vecin)

KNN este o tehnică neparametrică care poate fi utilizată atât pentru clasificare, cât și pentru regresie. Funcționează prin identificarea celor mai asemănătoare k puncte de date cu un nou punct de date și apoi prezicerea etichetei noului punct de date folosind etichetele acelor puncte de date.

5. Arborele de decizie

Arborii de decizie sunt un tip de tehnică de învățare supravegheată care poate fi utilizată atât pentru clasificare, cât și pentru regresie. Funcționează prin segmentarea datelor în grupuri din ce în ce mai mici, până când fiecare grup poate fi clasificat sau prezis cu un grad ridicat de acuratețe.

6. Pădurea aleatorie

Pădurile aleatorii sunt un tip de metodă de învățare prin ansamblu care utilizează un set de arbori de decizie pentru a face predicții prin agregarea predicțiilor din arbori individuali. Îmbunătățește precizia și rezistența arborilor de decizie unică. Poate fi folosit atât pentru sarcini de clasificare, cât și pentru sarcini de regresie.

7. Bayes naiv

Naive Bayes este un clasificator probabilistic bazat pe teorema lui Bayes, care este utilizat pentru sarcini de clasificare. Funcționează presupunând că caracteristicile unui punct de date sunt independente unele de altele.

8. PCA (Analiza componentelor principale)

PCA este o tehnică de reducere a dimensionalității utilizată pentru a transforma datele într-un spațiu de dimensiuni inferioare, păstrând în același timp cât mai multă variație posibil. Funcționează prin găsirea direcțiilor în datele care conțin cea mai mare variație și apoi proiectând datele în acele direcții.

9. Algoritmi apriori

Algoritmul Apriori este o tehnică tradițională de extragere a datelor pentru extragerea regulilor de asociere în bazele de date tranzacționale sau seturi de date. Este conceput pentru a descoperi legături și tipare între lucrurile care apar în mod regulat în tranzacții. Apriori detectează seturile de articole frecvente, care sunt grupuri de articole care apar împreună în tranzacții cu un nivel minim de suport dat.

10. K-Means Clustering

Gruparea K-Means este o abordare de învățare nesupravegheată care poate fi utilizată pentru a grupa punctele de date. Funcționează prin găsirea de k clustere în date, astfel încât punctele de date din fiecare cluster să fie cât mai asemănătoare între ele pe cât posibil, rămânând în același timp cât mai distincte posibil de punctele de date din alte clustere.

Descoperiți conceptele fundamentale care conduc învățarea automată prin învățarea primii 10 algoritmi , cum ar fi regresia liniară, arbori de decizie și rețele neuronale.

Algoritm de învățare automată – Întrebări frecvente

1. Ce este un algoritm în Machine Learning?

Algoritmi de învățare automată sunt tehnici bazate pe concepte statistice care permit computerelor să învețe din date, să descopere tipare, să facă predicții sau să finalizeze sarcini fără a fi nevoie de programare explicită. Acești algoritmi sunt clasificați pe scară largă în cele trei tipuri, adică învățare supravegheată, învățare nesupravegheată și învățare prin întărire.
ml la oz

2. Care sunt tipurile de învățare automată?

Există în principal trei tipuri de învățare automată:

Algoritm supravegheat

Algoritm nesupravegheat

Algoritmul de armare

3. Care algoritm ML este cel mai bun pentru predicție?

Metoda ideală de învățare automată pentru predicție este determinată de a număr de criterii , inclusiv natura problemei, tipul de date și cerințele unice. Abordările de suport Vector Machines, Random Forests și Gradient Boosting sunt populare pentru sarcinile de predicție. Selectarea unui algoritm, pe de altă parte, ar trebui să se bazeze pe testarea și evaluarea problemei specifice și a setului de date la îndemână.

4. Care sunt 10 algoritmi populari de învățare automată?‌

Mai jos este lista celor mai folosiți 10 algoritmi de învățare automată (ML):

Regresie liniara

Regresie logistică

SVM (Mașină Vector Suport)

KNN (K-cel mai apropiat vecin)

Arborele de decizie

Pădurea aleatorie

Bayes naiv

PCA (Analiza componentelor principale)

Algoritmi apriori

K-Means Clustering