Machine Learning [PDF]

  • 0 0 0
  • Gefällt Ihnen dieses papier und der download? Sie können Ihre eigene PDF-Datei in wenigen Minuten kostenlos online veröffentlichen! Anmelden
Datei wird geladen, bitte warten...
Zitiervorschau

Machine Learning 1. Définition de la Machine Learning : Dès les premiers jours de l’informatique, des machines ont été utilisées pour faire des calculs et des analyses financières. Cependant, les progrès récents de l’intelligence artificielle (IA), et plus particulièrement de l’apprentissage machine, ont introduit des moyens nouveaux et innovateurs d’exploiter la puissance de calcul pour une meilleure gestion financière. La Machine Learning – un sous-ensemble de l’intelligence artificielle ; alors que l’intelligence artificielle consiste à créer la conscience, La Machine Learning consiste à créer la compréhension. Cette nouvelle technologie, permet à l’ordinateur d’effectuer des tâches pour lesquelles il n’a pas été explicitement programmé en produisant lui-même des modèles et parfois même en les faisant évoluer à partir de nouvelles données. De ce fait, le Big Data est l’essence du Machine Learning. Ainsi, elle améliore sa performance en analysant une très grande quantité de données. Elle peut affiner ses paramètres afin de s’ajuster aux nouvelles données qu’il reçoit, améliorant ainsi progressivement et automatiquement sa performance.

2. Types de problèmes de machine Learning : Le machine Learning est un champ assez vaste, et nous intéressons dans cette partie à ses plus grandes classes de problèmes : 

L’apprentissage supervisé : son but est d’apprendre à faire des prédictions, à partir d’une liste d’exemples étiquetés, c’est-à-dire accompagnés de la valeur à prédire. Les étiquettes servent de « professeur » et supervisent l’apprentissage de l’algorithme. En effet, à partir de l’analyse d’un ensemble de données d’apprentissage connu, l’algorithme d’apprentissage supervisé produit une fonction inférée permettant de prédire les valeurs de sortie. Le système est capable de fournir des cibles pour toute nouvelle entrée après un apprentissage suffisant. Il peut également comparer sa sortie avec la sortie correcte prévue et trouver des erreurs afin de modifier le modèle en conséquence, et ceci peut s’écrire sous la forme suivante :Y =f ( X ) ou X représente l’ensemble des données d’entrée et Y les variables de sortie. Si la variable de sortie est continue, cela donnera un problème de régression alors que si elle est catégorielle, cela donnera un problème de classification dont l’objectif est de trouver une façon systématique de classer une nouvelle donnée, qui appartient `a l’ensemble de données d’entrées X, dans une catégorie d´définie au préalable. La classification de cette nouvelle donnée entrante se basera sur les connaissances que le modèle a pu acquérir `a partir d’un ´échantillon d’apprentissage forme de données similaires.



L’apprentissage non supervisé : dans le cadre de ce problème, il y a des données d’entrée mais il n’y a pas d’informations disponibles pour d´définir une variable de sortie appropriée. En fait, l’apprentissage par la machine se fait de façon totalement autonome puisque les informations utilisées ne sont ni classées ni étiquetées. Des

données sont alors communiquées à la machine sans lui fournir les exemples de résultats attendus en sortie. Concernant ce type de problème, le clustering, ou partitionnement lui appartient, il consiste à identifier des groupes dans les données, donc comprendre leurs caractéristiques générales, et éventuellement d’inférer les propriétés d’une observation en fonction du groupe auquel elle appartient.



L’apprentissage semi-supervisé : Ce type d’apprentissage est situé quelque part entre l’apprentissage supervisé et l’apprentissage non supervisé, car ils utilisent généralement et à la fois une petite quantité de données étiquetées et une grande quantité de donnée non étiquetées pour l’apprentissage. Les systèmes qui utilisent cette méthode sont capables d’améliorer considérablement la précision de l’apprentissage. Habituellement, l’apprentissage semi-supervisé est choisi lorsque les données étiquetées acquises nécessitent des ressources qualifiées et pertinentes pour les former / en tirer les leçons. Sinon, l’acquisition de données non étiquetées ne nécessite généralement pas de ressources supplémentaires.



L’apprentissage par renforcement - Reinforcement Learning : le système d’apprentissage peut interagir avec son environnement et accomplir des actions. En retour de ces actions, il obtient une récompense, qui peut être positive si l’action était un bon choix, ou négative dans le cas contraire. Ainsi, l’apprentissage consiste dans ce cas à définir une politique, c’est-à-dire une stratégie permettant d’obtenir systématiquement la meilleure récompense possible. Les applications principales de l’apprentissage par renforcement se trouvent dans les jeux (échecs, go, etc) et la robotique.

Dans le cadre de ce travail, nous allons aborder uniquement le problème d’apprentissage supervisé, et plus précisément la classification.

3. Le Machine Learning en finance : L’utilisation du Machine Learning en Finance ne cesse de se développer au cours de ces dernières années. Par ailleurs, nous remarquons que le secteur des services financiers est l’un des secteurs qui recrute le plus de Data Scientists. Dans ce qui suit, nous présentons les utilisations du Machine Learning en Finance :

 Trading et investissement : La Machine Learning sert à prendre de meilleures décisions de trading. Un modèle mathématique surveille les nouvelles et les résultats commerciaux en temps réel et détecte les tendances pouvant forcer la hausse ou la baisse des cours des actions. Il peut ensuite agir de manière proactive pour vendre, détenir ou acheter des actions en fonction de ses prévisions. Grace à cette moderne technologie, les traders obtiennent un léger avantage par rapport à la moyenne du marché. Et, compte tenu des vastes volumes d’opérations de négociation, ce petit avantage se traduit souvent par des bénéfices importants.

Dans le domaine de la gestion de Portefeuille, qui porte sur des investissements de plus long terme, La Machine Learning trouve ses applications les plus prometteuses. Les gestionnaires de portefeuilles utilisent La machine Learning pour analyser toutes les données d'entreprise disponibles (rapports financiers, communiqués de presse, news et même enregistrements sonores ou vidéos retranscrits) de manière à identifier les investissements les plus intéressants. L’idée est de mettre en évidence les relations pertinentes entre l’histoire opérationnelle et financière d’une entreprise et la performance de ses titres en bourse. De plus en plus de gestionnaires d’actifs utilisent ainsi La Machine Learning, soit pour prendre des décisions d’investissement, soit au moins pour appuyer ces décisions, avec l’ambition de produire des algorithmes capables de s’adapter à un environnement changeant de manière plus rapide que les solutions classiques développées par des quants.

 Gestion des risques Les solutions de machine learning permettent d’analyser en continu les comportements des traders, en utilisant non seulement l’historique des ordres passés mais aussi les échanges sur les messageries instantanées. Ces solutions s’avèrent bien plus efficaces que les méthodes traditionnelles, qui procèdent par sondages et a posteriori, pour identifier rapidement les comportements frauduleux ou les prises de risques non autorisées.

 Souscription d’assurance À court terme, le Machine Learning peut aider à automatiser de grands volumes de souscription d’assurances auto, habitation, etc. À l’avenir, l’intelligence artificielle améliorera la modélisation, en soulignant les considérations clés pour les décideurs humains qui auraient autrement pu passer inaperçues. La Machine Learning pourra assurer une souscription personnalisée par entreprise ou individu, en tenant compte de comportements et de circonstances uniques. La souscription améliorée peut tirer parti non seulement de l’apprentissage automatique pour l’exploration de données, mais également de la technologie portable et des analyseurs faciaux d’apprentissage en profondeur.

 Automatisation de processus L’automatisation des processus est l’une des applications les plus courantes de Machine Learning en finance. La technologie permet de remplacer le travail manuel, d’automatiser les tâches répétitives et d’augmenter la productivité. De ce fait, elle permet aux entreprises d’optimiser leurs coûts, d’améliorer l’expérience de leurs clients et de développer leurs services.

 Détection de fraude Les banques et les sociétés de services financiers ont recours à l’analyse pour différencier les interactions frauduleuses des transactions commerciales légitimes. En appliquant des outils d’analyse et d’apprentissage automatique, ils peuvent définir une activité normale en fonction de l’historique d’un client et le distinguer d’un comportement inhabituel indiquant une fraude. Les systèmes d’analyse suggèrent des actions immédiates, telles que le blocage des

transactions irrégulières, qui arrêtent les fraudes avant qu’elles ne se produisent et améliorent la rentabilité.

 Personnalisation profonde

Les entreprises se rendent compte que l’une des étapes essentielles pour être compétitif sur le marché actuel consiste à susciter l’engagement grâce à des relations personnalisées de haute qualité avec leurs clients. L’idée est d’analyser l’expérience client numérique et de la modifier en tenant compte des intérêts et des préférences du client.  l’IA améliore considérablement la compréhension du langage humain et des émotions, ce qui porte la personnalisation client à un tout autre niveau. Les Data Scientists peuvent également créer des modèles qui étudient le comportement des consommateurs et découvrent les situations dans lesquelles les clients ont besoin de conseils financiers. La combinaison d’outils d’analyse prédictive et d’options avancées de transmission numérique peut aider à cette tâche complexe, en guidant le client vers la meilleure solution financière au moment le plus opportun et en suggérant de personnaliser les offres en fonction des habitudes de consommation, des tendances sociodémographiques, de la localisation et d’autres préférences. 

3.1 Exemple d’utilisation de La Machine Learning : Plusieurs entreprises ont expérimenté, développé et utilisé des technologies d'intelligence artificielle et de Machine Learning. Voici quelques exemples :  Guardian Life Des chatbots pour améliorer l’expérience client chez Guardian Life : Chez le géant américain de l'assurance mutualiste Guardian Life, le DSI Dean Del Vecchio a utilisé l'intelligence artificielle et l’apprentissage machine pour améliorer l'expérience client (CX) et la productivité des employés. Dans son projet CX pilote, il a utilisé l’assistant virtuel Amelia de IPsoft pour automatiser le processus d'intégration et répondre aux questions des clients sur les prestations. L’objectif était de libérer du temps pour les employés et leur permettre de se concentrer sur des dossiers plus complexes. Formé à la logique d'affaires de Guardian Life, l’assistant Amelia répond à des questions telles que « Qu’entendez-vous par maladie grave ? », et à d'autres questions que les millions de clients de l’assureur pourraient poser. En interne, Gardian Life teste les capacités d’IA d’IBM Watson et comment elles peuvent aider l'entreprise à mieux comprendre la façon dont les clients interagissent avec ses offres. Dans le cadre du projet pilote, le logiciel d’informatique cognitive d'IBM lit et priorise les millions de courriels que Guardian Life reçoit chaque jour. L’analyse ne lui prend que quelques minutes et évite au personnel de consacrer des heures à lire manuellement les messages et à les classer par niveau de priorité. Il est important de construire ses projets de machine learning en tenant compte du contexte plus large de l'entreprise. Chez Guardian Life, l'automatisation des processus adossés à l’IA/ML ne représente qu'un aspect de la transformation numérique globale menée par son DSI. Dean Del Vecchio a entrepris une rationalisation générale des opérations tout en améliorant l’expérience client. Dans le cadre de cette rationalisation, il a engagé une

migration dans Amazon Web Services, adopté un développement agile et créé une boutique d’API.  MetLife : MetLife, l’un des principaux assureurs d’entreprise à l’échelle mondiale, utilise cette technique et le Big Data pour optimiser son activité. La reconnaissance de discours lui a permis d’améliorer le tracking d’accidents et de mieux mesurer leurs conséquences. Le traitement de réclamations est désormais mieux pris en charge car les modèles de réclamations ont été enrichis à l’aide de données non structurées qui peuvent être analysées par le biais de cette technologie.