types machine learning
Acest tutorial explică tipurile de învățare automată, adică învățare supravegheată, nesupravegheată, consolidată și semi-supravegheată, cu exemple simple. Veți afla, de asemenea, diferențele dintre învățarea supravegheată și supravegherea:
În Tutorial anterior , am aflat despre învățarea automată, funcționarea acesteia și aplicații. Am văzut, de asemenea, o comparație între învățarea automată și inteligența artificială.
Învățarea automată este un domeniu al științei care se ocupă cu învățarea programelor de calculator prin experiență și predicția rezultatului.
Principala caracteristică a ML este învățarea din experiență. Învățarea are loc atunci când sistemul alimentat cu date de intrare de formare modifică parametrii săi și se ajustează pentru a da rezultatul dorit. Rezultatul este valoarea țintă definită în datele de instruire.
ce este un fișier .bin
=> Citiți seria completă de formare pentru învățarea automată
Ce veți învăța:
- Tipuri de învățare automată
- Exemplu real de învățare supravegheată și nesupravegheată
- Diferența dintre învățarea supravegheată și supravegherea
- Învățare semi-supravegheată
- Concluzie
Tipuri de învățare automată
Programele de învățare automată sunt clasificate în 3 tipuri, după cum se arată mai jos.
- Supravegheat
- Fără supraveghere
- Consolidarea învățării
Să înțelegem fiecare dintre acestea în detaliu !!
# 1) Învățare supravegheată
Învățarea supravegheată are loc în prezența unui supraveghetor la fel ca învățarea efectuată de un copil mic cu ajutorul profesorului său. Pe măsură ce un copil este instruit să recunoască fructele, culorile, numerele sub supravegherea unui profesor, această metodă este învățarea supravegheată.
În această metodă, fiecare pas al copilului este verificat de către profesor și copilul învață din rezultatul pe care trebuie să îl producă.
Cum funcționează învățarea supravegheată?
În algoritmul ML supravegheat, ieșirea este deja cunoscută. Există o mapare a intrării cu ieșirea. Prin urmare, pentru a crea un model, mașina este alimentată cu o mulțime de date de intrare de formare (cunoscând intrarea și ieșirea corespunzătoare).
Datele de instruire ajută la atingerea unui nivel de precizie pentru modelul de date creat. Modelul construit este acum gata să fie alimentat cu date de intrare noi și să prezică rezultatele.
Ce este un set de date etichetat?
Setul de date cu ieșiri cunoscute pentru o intrare dată se numește set de date etichetat. De exemplu, este cunoscută o imagine a fructului împreună cu numele fructului. Deci, atunci când este prezentată o nouă imagine a fructelor, aceasta se compară cu setul de antrenament pentru a prezice răspunsul.
Învățarea supravegheată este un mecanism rapid de învățare cu o precizie ridicată. Problemele de învățare supravegheate includ probleme de regresie și clasificare.
Unii dintre algoritmii de învățare supravegheați sunt:
- Arbori de decizie,
- K-Cel mai apropiat vecin,
- Regresie liniara,
- Sprijină Vector Machine și
- Rețele neuronale.
Exemplu de învățare supravegheată
- În primul pas, un set de date de antrenament este introdus în algoritmul de învățare automată.
- Cu setul de date de antrenament, mașina se reglează singură, făcând modificări ale parametrilor pentru a construi un model logic.
- Modelul construit este apoi utilizat pentru un nou set de date pentru a prezice rezultatul.
Tipuri de algoritmi de învățare supravegheați
- Clasificare: În aceste tipuri de probleme, predicem răspunsul ca clase specifice, cum ar fi „da” sau „nu”. Când sunt prezente doar 2 clase, atunci se numește clasificare binară. Pentru mai mult de 2 valori de clasă, se numește clasificare multi-clasă. Valorile de răspuns prezise sunt valori discrete. De exemplu, Este imaginea soarelui sau a lunii? Algoritmul de clasificare separă datele în clase.
- Regresie: Problemele de regresie prezic răspunsul ca valori continue, cum ar fi prezicerea unei valori care variază de la -infinitate la infinit. Poate fi nevoie de multe valori. De exemplu, algoritmul de regresie liniar care se aplică, prezice costul casei pe baza multor parametri precum locația, aeroportul din apropiere, dimensiunea casei etc.
# 2) Învățare fără supraveghere
Învățarea nesupravegheată are loc fără ajutorul unui supraveghetor, la fel cum un pește învață să înoate singur. Este un proces de învățare independent.
În acest model, deoarece nu există nicio ieșire mapată cu intrarea, valorile țintă sunt necunoscute / neetichetate. Sistemul trebuie să învețe singur de la datele introduse și să detecteze tiparele ascunse.
Ce este setul de date fără etichetă?
Un set de date cu valori de ieșire necunoscute pentru toate valorile de intrare se numește set de date neetichetat.
Cum funcționează învățarea nesupravegheată?
Deoarece nu există valori de ieșire cunoscute care pot fi utilizate pentru a construi un model logic între intrare și ieșire, unele tehnici sunt utilizate pentru extragerea regulilor de date, a modelelor și a grupurilor de date cu tipuri similare. Aceste grupuri îi ajută pe utilizatorii finali să înțeleagă mai bine datele, precum și să găsească un rezultat semnificativ.
Intrările alimentate nu sunt sub forma unei structuri adecvate la fel cum sunt datele de instruire (în învățarea supravegheată). Poate conține valori anormale, date zgomotoase etc. Aceste intrări sunt alimentate împreună către sistem. În timp ce instruiți modelul, intrările sunt organizate pentru a forma clustere.
Algoritmii de învățare nesupravegheați includ algoritmi de grupare și de asociere, cum ar fi:
- Apriori,
- K-înseamnă clustering și alți algoritmi de extragere a regulilor de asociere.
Când datele noi sunt introduse în model, acesta va prezice rezultatul ca o etichetă de clasă căreia îi aparține intrarea. Dacă eticheta clasei nu este prezentă, atunci va fi generată o nouă clasă.
În timp ce trece prin procesul de descoperire a modelelor în date, modelul își ajustează parametrii de la sine, de aceea este numit și auto-organizare. Clusterele se vor forma prin aflarea asemănărilor dintre intrări.
De exemplu, în timp ce cumpărați produse online, dacă untul este pus în coș, atunci acesta sugerează cumpărarea de pâine, brânză etc. Modelul nesupravegheat analizează punctele de date și prezice celelalte atribute asociate cu produsul.
Exemplu de învățare fără supraveghere
Tipuri de algoritmi nesupravegheați
- Algoritm de grupare : Metodele de găsire a asemănărilor dintre elementele de date, cum ar fi aceeași formă, dimensiune, culoare, preț etc. și gruparea acestora pentru a forma un cluster este analiza clusterului.
- Detectare Outlier : În această metodă, setul de date este căutarea oricăror diferențe și anomalii în date. De exemplu, o tranzacție de mare valoare pe cardul de credit este detectată de sistem pentru detectarea fraudelor.
- Mineria regulilor de asociere : În acest tip de exploatare, află cele mai frecvente seturi de articole sau asociații între elemente. Asociații precum „produse cumpărate adesea împreună” etc.
- Autoencoderi: Intrarea este comprimată într-o formă codificată și este recreată pentru a elimina datele zgomotoase. Această tehnică este utilizată pentru a îmbunătăți calitatea imaginii și a videoclipului.
# 3) Învățarea prin întărire
În acest tip de învățare, algoritmul învață prin mecanism de feedback și experiențe din trecut. Este întotdeauna de dorit ca fiecare pas din algoritm să fie făcut pentru a atinge un obiectiv.
Deci, ori de câte ori urmează să se facă următorul pas, acesta primește feedback-ul din pasul anterior, împreună cu învățarea din experiență pentru a prezice care ar putea fi următorul cel mai bun pas. Acest proces este, de asemenea, numit proces de încercare și eroare pentru a atinge obiectivul.
Învățarea prin întărire este un proces iterativ pe termen lung. Cu cât numărul de feedback-uri este mai mare, cu atât sistemul devine mai precis. Învățarea de bază prin întărire este numită și procesul decizional Markov.
Exemplu de învățare prin întărire
Exemplu de învățare prin întărire este jocurile video, în care jucătorii completează anumite niveluri ale unui joc și câștigă puncte de recompensă. Jocul oferă feedback jucătorului prin mișcări bonus pentru a-și îmbunătăți performanța.
Învățarea prin întărire este utilizată în instruirea roboților, a mașinilor cu conducere automată, gestionarea automată a inventarului etc.
Unii algoritmi populari de învățare prin întărire includ:
- Q-Learning,
- Rețele adversare profunde
- Diferența temporală
Figura de mai jos descrie mecanismul de feedback al învățării prin întărire.
- Intrarea este observată de agentul care este elementul AI.
- Acest agent AI acționează asupra mediului în conformitate cu decizia luată.
- Răspunsul mediului este trimis AI sub forma unei recompense înapoi ca feedback.
- Starea și acțiunile efectuate asupra mediului sunt, de asemenea, salvate.
(imagine sursă )
Exemplu real de învățare supravegheată și nesupravegheată
Pentru învățarea supravegheată:
# 1) Să luăm un exemplu de coș cu legume cu ceapă, morcov, ridiche, roșii etc. și le putem aranja sub formă de grupuri.
#Două) Creăm un tabel de date de instruire pentru a înțelege învățarea supravegheată.
Tabelul cu date de antrenament caracterizează legumele pe baza:
- Formă
- Culoare
- mărimea
Formă | Culoare | mărimea | Vegetal |
---|---|---|---|
Este mai precisă decât învățarea nesupravegheată, deoarece datele de intrare și ieșirea corespunzătoare sunt bine cunoscute, iar aparatul trebuie doar să ofere predicții. | Are o acuratețe mai mică, deoarece datele de intrare sunt neetichetate. Astfel, mașina trebuie să înțeleagă și să eticheteze mai întâi datele și apoi să ofere predicții. | ||
Rundă | Maro | Mare | Ceapă |
Rundă | Net | Mediu | Roșie |
Cilindric | alb | Mare | Ridiche |
Cilindric | Net | Mediu | Morcov |
Când acest tabel de date de antrenament este introdus în mașină, acesta va construi un model logic folosind forma, culoarea, dimensiunea legumelor etc., pentru a prezice rezultatul (leguma).
Pe măsură ce o nouă intrare este alimentată acestui model, algoritmul va analiza parametrii și va afișa numele fructului.
Pentru învățarea fără supraveghere:
În învățarea nesupravegheată, creează grupuri sau clustere bazate pe atribute. În setul de date de mai sus, parametrul legumelor este:
# 1) Formă
Legumele sunt grupate în funcție de formă.
- Rundă: Ceapă și roșie.
- Cilindric: Ridichea și morcovul.
Luați un alt parametru, cum ar fi dimensiunea.
# 2) Dimensiune
Legumele sunt grupate în funcție de dimensiune și formă:
- Dimensiune medie și formă rotundă: Roșie
- Dimensiune mare și formă rotundă: Ceapă
În învățarea nesupravegheată, nu avem niciun set de date de formare și variabilă de rezultat, în timp ce în învățarea supravegheată, datele de formare sunt cunoscute și sunt utilizate pentru a antrena algoritmul.
Diferența dintre învățarea supravegheată și supravegherea
Supravegheat | Fără supraveghere |
---|---|
În algoritmii de învățare supravegheați, ieșirea pentru intrarea dată este cunoscută. | În algoritmii de învățare nesupravegheați, ieșirea pentru intrarea dată este necunoscută. |
Algoritmii învață dintr-un set de date etichetat. Aceste date ajută la evaluarea acurateței datelor de antrenament. | Algoritmul este furnizat cu date neetichetate, unde încearcă să găsească modele și asociații între elementele de date. |
Este o tehnică de modelare predictivă care prezice cu exactitate rezultatele viitoare. | Este o tehnică de modelare descriptivă care explică relația reală dintre elemente și istoria elementelor. |
Include algoritmi de clasificare și regresie. | Include algoritmi de învățare a regulilor de grupare și de asociere. |
Unii algoritmi de învățare supravegheată sunt Regresia liniară, Naïve Bayes și Neural Networks. | Unii algoritmi pentru învățarea nesupravegheată sunt k- clustering de mijloace, Apriori etc. |
Acest tip de învățare este relativ complex, deoarece necesită date etichetate. | Este mai puțin complex, deoarece nu este nevoie să înțelegeți și să etichetați datele. |
Este un proces online de analiză a datelor și nu necesită interacțiune umană. | Aceasta este o analiză a datelor în timp real. |
Învățare semi-supravegheată
Abordarea învățării semi-supravegheate necesită atât introducerea de date de formare etichetate, cât și cele neetichetate. Acest tip de învățare este util atunci când este dificil să extragem caracteristici utile din date neetichetate (abordare supravegheată), iar experților în date le este greu să eticheteze datele de intrare (abordare nesupravegheată).
Doar o cantitate mică de date etichetate în acești algoritmi poate duce la acuratețea modelului.
Exemple de învățare semi-supravegheată includ scanări CT și RMN, în cazul în care un expert medical poate eticheta câteva puncte în scanări pentru orice boală, în timp ce este dificil de etichetat toate scanările.
Concluzie
Sarcinile de învățare automată sunt în general clasificate în sarcini de învățare supravegheate, nesupravegheate, semi-supravegheate și de întărire.
Învățarea supravegheată este învățarea cu ajutorul datelor etichetate. Algoritmii ML sunt alimentați cu un set de date de antrenament în care pentru fiecare dată de intrare este cunoscută ieșirea, pentru a prezice rezultatele viitoare.
Acest model este extrem de precis și rapid, dar necesită expertiză ridicată și timp pentru a construi. De asemenea, aceste modele necesită reconstruirea dacă datele se schimbă. Sarcinile ML, cum ar fi regresia și clasificarea, sunt efectuate într-un mediu de învățare supravegheat.
Învățarea nesupravegheată are loc fără ajutorul unui supraveghetor. Datele de intrare introduse în algoritmii ML nu sunt etichetate, adică pentru fiecare intrare nu se cunoaște nicio ieșire. Algoritmul însuși găsește tendințele și modelul din datele de intrare și creează o asociere între diferitele atribute ale intrării.
Acest tip de învățare este util pentru găsirea de tipare în date, crearea de grupuri de date și analiza în timp real. Sarcini precum Clustering, algoritmi KNN etc. aparțin învățării nesupravegheate.
Sarcinile de învățare semi-supravegheate avantajul algoritmilor supravegheați și nesupravegheați prin prezicerea rezultatelor folosind atât date etichetate, cât și neetichetate. Învățarea prin întărire este un tip de mecanism de feedback în care mașina învață din feedback-ul constant din mediu pentru a-și atinge scopul.
În acest tip de învățare, agenții AI efectuează unele acțiuni asupra datelor, iar mediul oferă o recompensă. Învățarea prin întărire este folosită de jocurile multiplayer pentru copii, mașini cu conducere automată etc.
Fiți la curent cu următorul nostru tutorial pentru a afla mai multe despre învățarea automată și rețeaua de neuroni artificiali!
=> Vizitați aici pentru seria exclusivă de învățare automată
Lectură recomandată
- Data Mining Vs Machine Learning Vs Intelligence Artificial Vs Deep Learning
- 11 Cele mai populare instrumente software de învățare automată în 2021
- Tutorial de învățare automată: Introducere în ML și aplicațiile sale
- Tipuri de date Python
- Tipuri de date C ++
- Tipuri de riscuri în proiectele software
- Tipuri de testare a migrării: cu scenarii de testare pentru fiecare tip
- Cele mai bune 15 sisteme de management al învățării (LMS ale anului 2021)