Différence clé - Apprentissage automatique supervisé ou non supervisé
L'apprentissage supervisé et l'apprentissage non supervisé sont deux concepts fondamentaux de l'apprentissage automatique. L'apprentissage supervisé est une tâche d'apprentissage automatique consistant à apprendre une fonction qui mappe une entrée à une sortie sur la base des exemples de paires d'entrée-sortie. L'apprentissage non supervisé est la tâche d'apprentissage automatique consistant à déduire une fonction pour décrire une structure cachée à partir de données non étiquetées. La principale différence entre l'apprentissage automatique supervisé et non supervisé est que l'apprentissage supervisé utilise des données étiquetées tandis que l'apprentissage non supervisé utilise des données non étiquetées.
L'apprentissage automatique est un domaine de l'informatique qui permet à un système informatique d'apprendre à partir de données sans être explicitement programmé. Il permet d'analyser les données et d'en prédire les modèles. Il existe de nombreuses applications de l'apprentissage automatique. Certains d'entre eux sont la reconnaissance faciale, la reconnaissance gestuelle et la reconnaissance vocale. Il existe différents algorithmes liés à l'apprentissage automatique. Certains d'entre eux sont la régression, la classification et le regroupement. Les langages de programmation les plus courants pour le développement d'applications basées sur l'apprentissage automatique sont R et Python. D'autres langages tels que Java, C ++ et Matlab peuvent également être utilisés.
CONTENU
1. Présentation et différence clé
2. Qu'est-ce que l'apprentissage supervisé
3. Qu'est-ce que l'apprentissage non supervisé
4. Similitudes entre l'apprentissage automatique supervisé et non supervisé
5. Comparaison côte à côte - Apprentissage automatique supervisé et non supervisé sous forme tabulaire
6. Résumé
Qu'est-ce que l'apprentissage supervisé?
Dans les systèmes basés sur l'apprentissage automatique, le modèle fonctionne selon un algorithme. Dans l'apprentissage supervisé, le modèle est supervisé. Tout d'abord, il est nécessaire de former le modèle. Avec les connaissances acquises, il peut prédire les réponses pour les instances futures. Le modèle est entraîné à l'aide d'un ensemble de données étiqueté. Lorsqu'une donnée hors échantillon est fournie au système, il peut prédire le résultat. Voici un petit extrait du jeu de données IRIS populaire.
Selon le tableau ci-dessus, la longueur du sépale, la largeur du sépale, la longueur du patel, la largeur du patel et l'espèce sont appelés les attributs. Les colonnes sont appelées fonctionnalités. Une ligne contient des données pour tous les attributs. Par conséquent, une ligne est appelée une observation. Les données peuvent être numériques ou catégoriques. Le modèle reçoit les observations avec le nom d'espèce correspondant comme entrée. Lorsqu'une nouvelle observation est donnée, le modèle doit prédire le type d'espèce à laquelle il appartient.
Dans l'apprentissage supervisé, il existe des algorithmes de classification et de régression. La classification est le processus de classification des données étiquetées. Le modèle a créé des limites qui séparaient les catégories de données. Lorsque de nouvelles données sont fournies au modèle, il peut être catégorisé en fonction de l'emplacement du point. Le K-Nearest Neighbours (KNN) est un modèle de classification. En fonction de la valeur k, la catégorie est décidée. Par exemple, lorsque k vaut 5, si un point de données particulier est proche de huit points de données dans la catégorie A et de six points de données dans la catégorie B, alors le point de données sera classé comme A.
La régression est le processus de prédiction de la tendance des données précédentes pour prédire le résultat des nouvelles données. Dans la régression, la sortie peut être constituée d'une ou plusieurs variables continues. La prédiction est effectuée à l'aide d'une ligne qui couvre la plupart des points de données. Le modèle de régression le plus simple est une régression linéaire. Il est rapide et ne nécessite pas de paramètres de réglage tels que KNN. Si les données montrent une tendance parabolique, alors le modèle de régression linéaire ne convient pas.
Ce sont quelques exemples d'algorithmes d'apprentissage supervisé. En général, les résultats générés par les méthodes d'apprentissage supervisé sont plus précis et fiables car les données d'entrée sont bien connues et étiquetées. Par conséquent, la machine doit analyser uniquement les modèles cachés.
Qu'est-ce que l'apprentissage non supervisé?
Dans l'apprentissage non supervisé, le modèle n'est pas supervisé. Le modèle fonctionne seul, pour prédire les résultats. Il utilise des algorithmes d'apprentissage automatique pour tirer des conclusions sur des données non étiquetées. En général, les algorithmes d'apprentissage non supervisé sont plus difficiles que les algorithmes d'apprentissage supervisé car il y a peu d'informations. Le clustering est un type d'apprentissage non supervisé. Il peut être utilisé pour regrouper les données inconnues à l'aide d'algorithmes. La k-moyenne et la classification basée sur la densité sont deux algorithmes de classification.
Algorithme k-moyenne, place k centroïde aléatoirement pour chaque cluster. Ensuite, chaque point de données est affecté au centre de gravité le plus proche. La distance euclidienne est utilisée pour calculer la distance entre le point de données et le centre de gravité. Les points de données sont classés en groupes. Les positions des k centroïdes sont à nouveau calculées. La nouvelle position du centre de gravité est déterminée par la moyenne de tous les points du groupe. Là encore, chaque point de données est affecté au centre de gravité le plus proche. Ce processus se répète jusqu'à ce que les centres de gravité ne changent plus. k-mean est un algorithme de clustering rapide, mais il n'y a pas d'initialisation spécifiée des points de clustering. En outre, il existe une grande variation des modèles de clustering basés sur l'initialisation des points de cluster.
Un autre algorithme de clustering est le clustering basé sur la densité. Il est également connu sous le nom d'applications de clustering spatial basées sur la densité avec bruit. Il fonctionne en définissant un cluster comme l'ensemble maximal de points connectés de densité. Ce sont deux paramètres utilisés pour le clustering basé sur la densité. Ils sont Ɛ (epsilon) et points minimum. Le Ɛ est le rayon maximum du voisinage. Les points minimum sont le nombre minimum de points dans le voisinage Ɛ pour définir un cluster. Ce sont quelques exemples de clustering qui s'inscrit dans l'apprentissage non supervisé.
En général, les résultats générés à partir d'algorithmes d'apprentissage non supervisés ne sont pas très précis et fiables car la machine doit définir et étiqueter les données d'entrée avant de déterminer les modèles et fonctions cachés.
Quelle est la similitude entre l'apprentissage automatique supervisé et non supervisé?
L'apprentissage supervisé et non supervisé sont des types d'apprentissage automatique
Quelle est la différence entre l'apprentissage automatique supervisé et non supervisé?
Diff article au milieu avant la table
Machine Learning supervisé vs non supervisé |
|
L'apprentissage supervisé est la tâche d'apprentissage automatique consistant à apprendre une fonction qui mappe une entrée à une sortie basée sur des exemples de paires d'entrée-sortie. | L'apprentissage non supervisé est la tâche d'apprentissage automatique consistant à déduire une fonction pour décrire une structure cachée à partir de données non étiquetées. |
Fonctionnalité principale | |
Dans l'apprentissage supervisé, le modèle prédit le résultat en fonction des données d'entrée étiquetées. | Dans l'apprentissage non supervisé, le modèle prédit le résultat sans données étiquetées en identifiant lui-même les modèles. |
Exactitude des résultats | |
Les résultats générés par les méthodes d'apprentissage supervisé sont plus précis et plus fiables. | Les résultats générés par des méthodes d'apprentissage non supervisées ne sont pas très précis et fiables. |
Principaux algorithmes | |
Il existe des algorithmes de régression et de classification dans l'apprentissage supervisé. | Il existe des algorithmes pour le clustering dans l'apprentissage non supervisé. |
Résumé - Apprentissage automatique supervisé vs non supervisé
L'apprentissage supervisé et l'apprentissage non supervisé sont deux types d'apprentissage automatique. L'apprentissage supervisé est la tâche d'apprentissage automatique consistant à apprendre une fonction qui mappe une entrée à une sortie basée sur des exemples de paires d'entrée-sortie. L'apprentissage non supervisé est la tâche d'apprentissage automatique consistant à déduire une fonction pour décrire une structure cachée à partir de données non étiquetées. La différence entre l'apprentissage automatique supervisé et non supervisé est que l'apprentissage supervisé utilise des données étiquetées tandis que l'apprentissage non supervisé utilise des données non étiquetées.