Control ML [PDF]

  • 0 0 0
  • Gefällt Ihnen dieses papier und der download? Sie können Ihre eigene PDF-Datei in wenigen Minuten kostenlos online veröffentlichen! Anmelden
Datei wird geladen, bitte warten...
Zitiervorschau

Année Universitaire Année Universitaire 2019-2020 2022-2023

Université Mohammed V Faculté des Sciences de Rabat Département Informatique

Master IAO.

Machine Learning (Contrô le Continu) Durée : 2h00

Question de cours: 1) 2) 3) 4) 5)

Qu’est-ce qu’un hyper-paramètre? Donner des exemples Quelle est la relation entre le Biais et la variance? Quel est l’objectif de la régularisation? Donner la différence entre : données, information et connaissance? La régression logistique est cas spéciale de régression linéaire, oui ou non? Justifier la réponse

QCM: (5pts) cocher la bonne réponse: Q1 : Tous les exemples suivants sont des applications de machine Learning, sauf: a) Personnaliser les campagnes de marketing en fonction de la démographie des clients et de leur historique d'achat. b) Détecter les activités frauduleuses dans des transactions financières. c) Analyser les IdO (internet des objets) afin de prédire les problèmes d'équipements avant qu'ils se produisent. d) Analyser les revenus passés pour déterminer la cause de la chute des ventes. Q2 : Une entreprise veut prédire le prix d’un plein de carburant, connaissant les caractéristiques d'une voiture. Est-ce un problème de régression ou de classification ? a) C'est un problème de régression. b) C'est un problème de classification. Q3 : On dispose d’une grande banque de textes qu’on veut catégoriser automatiquement par thématique. Aucun des documents n’a de thématique associée pour le moment. Comment vais-je entraîner mon modèle ? a) De manière supervisée b) De manière non-supervisée Q4:Dans l'apprentissage d'ensemble, vous agrégez les prédictions pour les apprenants faibles, de sorte qu'un ensemble de ces modèles donnera une meilleure prédiction que la prédiction de modèles individuels. Lequel des énoncés suivants est/sont vrais pour les apprenants faibles utilisés dans le modèle d'ensemble ? 1. Ne souffrent pas généralement de sur-apprentissage.

1/4

Année Universitaire Année Universitaire 2019-2020 2022-2023

Université Mohammed V Faculté des Sciences de Rabat Département Informatique

a) b) c) d) e) f)

Master IAO.

2. Ils ont un biais élevé, ils ne peuvent donc pas résoudre des problèmes d'apprentissage complexes 3. Ils souffrent généralement de sur-apprentissage. 1 et 2 1 et 3 2 et 3 Seulement 1 Seulement 2 Aucunes des réponses

Exercice 1: Q1- Ali veut écrire un programme qui utilise la fréquence des mots «science», « public », « accès », «université », « gouvernement », « financer », « éducation », «budget», «justice» et «loi» pour déterminer si un article traite ou non de politique scientifique. Elle a commencé par annoter un millier d’articles selon leur sujet. - Quel genre de problème d’apprentissage automatique doit-elle résoudre ? Q2- Parmi les problèmes suivants, lesquels se prêtent bien à être traités par le Machine Learning? 1. Déterminer l’horaire optimal pour poster un contenu sur une page web. 2. Déterminer le chemin le plus court entre deux nœuds dans un graphe. 2. Prédire le nombre de vélos à mettre en location à chaque station d’un système de location de 3. vélos citadins. 4. Évaluer le prix qu’un tableau de maître pourra atteindre lors d’une vente aux enchères. 5. Débruiter un signal radio. Q3- Bilal dispose de 10000 articles de journaux qu’il souhaite classer par leur thématique. Doit-il utiliser un algorithme supervisé ou non supervisé ? Q4- Ahmed gère un outil qui permet d’organiser les liens HTML qui ont été sauvegardés. Il souhaite suggérer des catégories auxquelles affecter un nouveau lien, en fonction des catégories déjà définies par l’ensemble des utilisateurs du service. Quel type d’algorithme d’apprentissage doit-il utiliser ? Q5- Amine veut examiner ses spams pour déterminer s’il existe des sous-types de spams. Quel type d’algorithme d’apprentissage doit-il utiliser?

2/4

Année Universitaire Année Universitaire 2019-2020 2022-2023

Université Mohammed V Faculté des Sciences de Rabat Département Informatique

Master IAO.

Exercice 2: Les Systèmes de recommandation On veut réaliser un système de recommandation des films, en se basant sur le jeu de données comportant les données comme suit:

Movies.csv

Tags.csv

Links.csv

-

Le fichier movies.csv représente les catégories des films (genres). Le fichier links.csv représente les interactions des utilisateurs (identifiés par userId) vis-àvis les films sous forme de votes numériques (ratings) dont leurs valeurs sont comprises entre 1.0 et 5.0. Le fichier tags.csv représente les interactions des utilisateurs vis-à-vis les films sous forme de chaines de caractères (tag).

Questions: 1) Quels sont les différents types des algorithmes de recommandation? Lesquels sont les plus susceptibles d’être utilisées en adéquation avec le jeu de données présenté ci-dessus ? 2) Donner les commandes Python qui permettront de charger les 3 fichiers, tout en important les librairies nécessaires? 3) Nous voulons catégoriser les films en calculant les similarités en se basant sur leurs genres en utilisant l’algorithme KNN. a- Quel est/sont le/les fichier/s à utiliser? Décrire les principales opérations à réaliser dans la phase de préparation et nettoyage des données. b- Décrire le principe de KNN ? comment va-t-il s’appliquer dans notre cas? c- Nous voulons tester la qualité du modèle appris, quelle est la démarche à suivre? d- Nous voulons apprendre le modèle pour k= 3, 5 et 10. Comment choisir le k optimal? 3/4

Année Universitaire Année Universitaire 2019-2020 2022-2023

Université Mohammed V Faculté des Sciences de Rabat Département Informatique

Master IAO.

e- Donner le principe de validation croisée? Expliquer la démarche utilisée dans le cadre de 4-fold validation ? 4) Y’a-t-il une autre technique qui pourra être utilisé au lieu de KNN ? justifier la réponse. 5) Que fais le code qui suit:

Ajouter des commentaires sur chaque bloc d’instruction en décrivant ce qu’il fait.

4/4