Télécharger le PDF
1) Qu'est-ce que l'apprentissage automatique?
L'apprentissage automatique est une branche de l'informatique qui traite de la programmation système afin d'apprendre et de s'améliorer automatiquement avec l'expérience. Par exemple: les robots sont programmés de manière à pouvoir effectuer la tâche en fonction des données qu'ils collectent à partir des capteurs. Il apprend automatiquement les programmes à partir des données.
2) Mentionner la différence entre l'exploration de données et l'apprentissage automatique?
L'apprentissage automatique concerne l'étude, la conception et le développement d'algorithmes qui donnent aux ordinateurs la capacité d'apprendre sans être explicitement programmés. Alors que l'exploration de données peut être définie comme le processus dans lequel les données non structurées essaient d'extraire des connaissances ou des modèles intéressants inconnus. Au cours de cette machine de processus, des algorithmes d'apprentissage sont utilisés.
3) Qu'est-ce que le «surapprentissage» dans l'apprentissage automatique?
Dans l'apprentissage automatique, lorsqu'un modèle statistique décrit une erreur aléatoire ou un bruit au lieu d'une relation sous-jacente, un «surajustement» se produit. Lorsqu'un modèle est excessivement complexe, un surajustement est normalement observé, en raison du trop grand nombre de paramètres par rapport au nombre de types de données d'apprentissage. Le modèle présente des performances médiocres qui ont été sur-ajustées.
4) Pourquoi le surajustement se produit-il?
La possibilité d'un surajustement existe car les critères utilisés pour entraîner le modèle ne sont pas les mêmes que les critères utilisés pour juger de l'efficacité d'un modèle.
5) Comment éviter le surajustement?
En utilisant beaucoup de données, le surajustement peut être évité, le surajustement se produit relativement car vous avez un petit ensemble de données et que vous essayez d'en tirer des leçons. Mais si vous avez une petite base de données et que vous êtes obligé de venir avec un modèle basé sur cela. Dans une telle situation, vous pouvez utiliser une technique connue sous le nom de validation croisée . Dans cette méthode, le jeu de données se divise en deux sections, les jeux de données de test et de formation, le jeu de données de test testera uniquement le modèle tandis que, dans le jeu de données de formation, les points de données fourniront le modèle.
Dans cette technique, un modèle reçoit généralement un ensemble de données d'une donnée connue sur laquelle l'entraînement (ensemble de données d'entraînement) est exécuté et un ensemble de données de données inconnues par rapport auquel le modèle est testé. L'idée de la validation croisée est de définir un jeu de données pour «tester» le modèle dans la phase d'apprentissage.
6) Qu'est-ce que l'apprentissage automatique inductif?
L'apprentissage automatique inductif implique le processus d'apprentissage par des exemples, où un système, à partir d'un ensemble d'instances observées, tente d'induire une règle générale.
7) Quels sont les cinq algorithmes populaires de l'apprentissage automatique?
- Arbres de décision
- Réseaux de neurones (rétro-propagation)
- Réseaux probabilistes
- Voisin le plus proche
- Soutenir les machines vectorielles
8) Quelles sont les différentes techniques d'algorithme dans le Machine Learning?
Les différents types de techniques du Machine Learning sont
- Enseignement supervisé
- Apprentissage non supervisé
- Apprentissage semi-supervisé
- Apprentissage par renforcement
- Transduction
- Apprendre à apprendre
9) Quelles sont les trois étapes pour construire les hypothèses ou le modèle en apprentissage automatique?
- Construction de modèles
- Test de modèle
- Appliquer le modèle
10) Quelle est l'approche standard de l'apprentissage supervisé?
L'approche standard de l'apprentissage supervisé consiste à diviser l'ensemble d'exemples en l'ensemble de formation et le test.
11) Qu'est-ce que «Ensemble de formation» et «Ensemble de test»?
Dans divers domaines de la science de l'information comme l'apprentissage automatique, un ensemble de données est utilisé pour découvrir la relation potentiellement prédictive connue sous le nom de «Ensemble d'entraînement». L'ensemble de formation est un exemple donné à l'apprenant, tandis que l'ensemble de test est utilisé pour tester l'exactitude des hypothèses générées par l'apprenant, et c'est l'ensemble d'exemples retenu à l'apprenant. L'ensemble de formation est distinct de l'ensemble de test.
12) Énumérez diverses approches pour l'apprentissage automatique?
Les différentes approches du Machine Learning sont
- Apprentissage de la classification entre le concept et la classification
- Apprentissage statistique vs symbolique
- Apprentissage inductif vs analytique
13) Qu'est-ce que le Machine Learning?
- Intelligence artificielle
- Inférence basée sur des règles
14) Expliquez quelle est la fonction de «l'apprentissage non supervisé»?
- Trouver des grappes de données
- Trouver des représentations en basse dimension des données
- Trouvez des directions intéressantes dans les données
- Coordonnées et corrélations intéressantes
- Trouver de nouvelles observations / nettoyage de base de données
15) Expliquez quelle est la fonction de «l'apprentissage supervisé»?
- Classifications
- Reconnaissance de la parole
- Régression
- Prédire les séries chronologiques
- Annoter les chaînes
16) Qu'est-ce que l'apprentissage automatique indépendant de l'algorithme?
L'apprentissage automatique dans lequel les fondements mathématiques sont indépendants de tout classificateur ou algorithme d'apprentissage particulier est appelé apprentissage automatique indépendant de l'algorithme?
17) Quelle est la différence entre l'apprentissage artificiel et l'apprentissage automatique?
La conception et le développement d'algorithmes en fonction des comportements basés sur des données empiriques sont connus sous le nom de Machine Learning. Bien que l'intelligence artificielle en plus de l'apprentissage automatique, elle couvre également d'autres aspects tels que la représentation des connaissances, le traitement du langage naturel, la planification, la robotique, etc.
18) Qu'est-ce que le classificateur dans l'apprentissage automatique?
Un classificateur dans un Machine Learning est un système qui entre un vecteur de valeurs d'entités discrètes ou continues et qui génère une seule valeur discrète, la classe.
19) Quels sont les avantages de Naive Bayes?
Dans Naïve Bayes, le classificateur convergera plus rapidement que les modèles discriminants comme la régression logistique, vous avez donc besoin de moins de données d'entraînement. Le principal avantage est qu'il ne peut pas apprendre les interactions entre les fonctionnalités.
20) Dans quels domaines la reconnaissance de formes est-elle utilisée?
La reconnaissance de formes peut être utilisée dans
- Vision par ordinateur
- Reconnaissance de la parole
- Exploration de données
- Statistiques
- Récupération informelle
- Bio-informatique
21) Qu'est-ce que la programmation génétique?
La programmation génétique est l'une des deux techniques utilisées dans l'apprentissage automatique. Le modèle est basé sur les tests et la sélection du meilleur choix parmi un ensemble de résultats.
22) Qu'est-ce que la programmation logique inductive dans l'apprentissage automatique?
La programmation logique inductive (ILP) est un sous-domaine de l'apprentissage automatique qui utilise une programmation logique représentant des connaissances de base et des exemples.
23) Qu'est-ce que la sélection de modèle dans l'apprentissage automatique?
Le processus de sélection de modèles parmi différents modèles mathématiques, qui sont utilisés pour décrire le même ensemble de données, est appelé Sélection de modèle. La sélection de modèles est appliquée aux domaines des statistiques, de l'apprentissage automatique et de l'exploration de données.
24) Quelles sont les deux méthodes utilisées pour l'étalonnage dans l'apprentissage supervisé?
Les deux méthodes utilisées pour prédire les bonnes probabilités en apprentissage supervisé sont
- Étalonnage du plateau
- Régression isotonique
Ces méthodes sont conçues pour la classification binaire, et ce n'est pas trivial.
25) Quelle méthode est fréquemment utilisée pour éviter le surajustement?
Lorsqu'il y a suffisamment de données, la «régression isotonique» est utilisée pour éviter un problème de surajustement.
26) Quelle est la différence entre l'heuristique pour l'apprentissage des règles et l'heuristique pour les arbres de décision?
La différence est que l'heuristique des arbres de décision évalue la qualité moyenne d'un certain nombre d'ensembles disjoints, tandis que les apprenants de règles n'évaluent que la qualité de l'ensemble d'instances couvert par la règle candidate.
27) Qu'est-ce que Perceptron dans l'apprentissage automatique?
Dans le Machine Learning, Perceptron est un algorithme de classification supervisée de l'entrée dans l'une des nombreuses sorties non binaires possibles.
28) Expliquer les deux composants du programme de logique bayésienne?
Le programme de logique bayésienne se compose de deux composants. Le premier élément est logique; il consiste en un ensemble de clauses bayésiennes, qui capture la structure qualitative du domaine. Le deuxième composant est quantitatif, il encode les informations quantitatives sur le domaine.
29) Que sont les réseaux bayésiens (BN)?
Le réseau bayésien est utilisé pour représenter le modèle graphique de la relation de probabilité entre un ensemble de variables.
30) Pourquoi un algorithme d'apprentissage basé sur une instance parfois appelé algorithme d'apprentissage paresseux?
L'algorithme d'apprentissage basé sur une instance est également appelé algorithme d'apprentissage paresseux car il retarde le processus d'induction ou de généralisation jusqu'à ce que la classification soit effectuée.
31) Quelles sont les deux méthodes de classification que SVM (Support Vector Machine) peut gérer?
- Combiner des classificateurs binaires
- Modification du binaire pour incorporer l'apprentissage multiclasse
32) Qu'est-ce que l'apprentissage d'ensemble?
Pour résoudre un programme de calcul particulier, plusieurs modèles tels que des classificateurs ou des experts sont générés et combinés de manière stratégique. Ce processus est connu sous le nom d'apprentissage d'ensemble.
33) Pourquoi l'apprentissage d'ensemble est-il utilisé?
L'apprentissage d'ensemble est utilisé pour améliorer la classification, la prédiction, l'approximation des fonctions, etc. d'un modèle.
34) Quand utiliser l'apprentissage d'ensemble?
L'apprentissage d'ensemble est utilisé lorsque vous créez des classificateurs de composants plus précis et indépendants les uns des autres.
35) Quels sont les deux paradigmes des méthodes d'ensemble?
Les deux paradigmes des méthodes d'ensemble sont
- Méthodes d'ensemble séquentielles
- Méthodes d'ensemble parallèles
36) Quel est le principe général d'une méthode d'ensemble et qu'est-ce que l'ensachage et le boosting en méthode d'ensemble?
Le principe général d'une méthode d'ensemble est de combiner les prédictions de plusieurs modèles construits avec un algorithme d'apprentissage donné afin d'améliorer la robustesse sur un seul modèle. L'ensachage est une méthode d'ensemble pour améliorer les schémas d'estimation ou de classification instables. Tandis que la méthode d'amplification est utilisée séquentiellement pour réduire le biais du modèle combiné. Boosting et Bagging peuvent tous deux réduire les erreurs en réduisant le terme de variance.
37) Qu'est-ce que la décomposition biais-variance de l'erreur de classification dans la méthode d'ensemble?
L'erreur attendue d'un algorithme d'apprentissage peut être décomposée en biais et variance. Un terme de biais mesure à quel point le classificateur moyen produit par l'algorithme d'apprentissage correspond à la fonction cible. Le terme de variance mesure dans quelle mesure la prédiction de l'algorithme d'apprentissage fluctue pour différents ensembles d'apprentissage.
38) Qu'est-ce qu'un algorithme d'apprentissage incrémental en ensemble?
La méthode d'apprentissage incrémentiel est la capacité d'un algorithme à apprendre à partir de nouvelles données qui peuvent être disponibles après que le classificateur a déjà été généré à partir d'un ensemble de données déjà disponible.
39) À quoi servent les PCA, KPCA et ICA?
L'ACP (Analyse en Composants Principaux), KPCA (Analyse en Composantes Principales basée sur le noyau) et ICA (Analyse en Composants Indépendants) sont des techniques d'extraction de caractéristiques importantes utilisées pour la réduction de la dimensionnalité.
40) Qu'est-ce que la réduction de dimension dans le Machine Learning?
Dans le Machine Learning et les statistiques, la réduction de dimension est le processus de réduction du nombre de variables aléatoires à prendre en compte et peut être divisée en sélection d'entités et extraction d'entités.
41) Que sont les machines vectorielles de support?
Les machines à vecteurs de support sont des algorithmes d'apprentissage supervisé utilisés pour l'analyse de classification et de régression.
42) Quelles sont les composantes des techniques d'évaluation relationnelle?
Les composants importants des techniques d'évaluation relationnelle sont
- L'acquisition des données
- Acquisition de la vérité au sol
- Technique de validation croisée
- Type de requête
- Mesure de notation
- Test de signification
43) Quelles sont les différentes méthodes d'apprentissage supervisé séquentiel?
Les différentes méthodes pour résoudre les problèmes d'apprentissage supervisé séquentiel sont
- Méthodes de fenêtre coulissante
- Fenêtres coulissantes récurrentes
- Modèles de Markow cachés
- Modèles de Markow à entropie maximale
- Champs aléatoires conditionnels
- Réseaux de transformateurs graphiques
44) Quels sont les domaines de la robotique et du traitement de l'information où se pose un problème de prédiction séquentielle?
Les domaines de la robotique et du traitement de l'information où se pose un problème de prédiction séquentielle sont
- Apprentissage par imitation
- Prédiction structurée
- Apprentissage par renforcement basé sur un modèle
45) Qu'est-ce que l'apprentissage statistique par lots?
Les techniques d'apprentissage statistique permettent d'apprendre une fonction ou un prédicteur à partir d'un ensemble de données observées qui peuvent faire des prédictions sur des données invisibles ou futures. Ces techniques fournissent des garanties sur les performances du prédicteur appris sur les futures données non vues basées sur une hypothèse statistique sur le processus de génération de données.
46) Qu'est-ce que l'apprentissage PAC?
L'apprentissage PAC (Probably Approximately Correct) est un cadre d'apprentissage qui a été introduit pour analyser les algorithmes d'apprentissage et leur efficacité statistique.
47) Quelles sont les différentes catégories que vous pouvez catégoriser le processus d'apprentissage séquentiel?
- Prédiction de séquence
- Génération de séquence
- Reconnaissance de séquence
- Décision séquentielle
48) Qu'est-ce que l'apprentissage séquentiel?
L'apprentissage séquentiel est une méthode d'enseignement et d'apprentissage d'une manière logique.
49) Quelles sont les deux techniques d'apprentissage automatique?
Les deux techniques d'apprentissage automatique sont
- Programmation génétique
- Apprentissage inductif
Le moteur de recommandation mis en œuvre par les principaux sites Web de commerce électronique utilise le Machine Learning.