MEDECINE ET ROBOTIQUE

MEDECINE ET ROBOTIQUE

LEXIQUE DE L'IA EN SANTE : QU'EST-CE QUE L'APPRENTISSAGE MACHINE?

Nous vous proposons d'essayer de comprendre l'IA au travers de ses mots. Le lexique répond à un objectif didactique. Les mots sont choisis pour leur importance en IA médicale. Ils ne sont pas publiés par ordre alphabétique mais selon un schéma visant à apporter une compréhension progressive du sujet. Pour faciliter la lecture en ces temps de surcharge médiatique, le lexique n'est pas publié en une fois mais sous la forme d'une série d'articles. Les références bibliographiques utilisées sont indiquées en fin de page. 

 

MOT N°3: APPRENTISSAGE MACHINE

En anglais: machine learning

C’est le coeur de l’intelligence artificielle. Le terme apprentissage machine regroupe l’ensemble des méthodes informatiques destinées à rendre une machine autonome. La machine n’est plus programmée explicitement pour une tâche précise, elle s’auto-programme. Elle acquiert la capacité de s’adapter par elle-même à des variations de ses données d’entrée.

 

Il existe de nombreuses méthodes d’apprentissage machine. La plus connue et la plus efficace à ce jour est l'apprentissage profond (en anglais: deep learning). Mais, comme nous le verrons dans la suite de ce lexique, il n’est qu’une méthode parmi d’autres et n’est pas l’aboutissement de l’intelligence artificielle. D’autres méthodes, plus performantes, sont à l'étude et pourraient supplanter l'apprentissage profond prochainement. 

 

Quelle que soit la méthode utilisée, l’apprentissage machine doit respecter certaines étapes communes. Il s’agit des phases d'entraînement, de validation et de test. Ces termes se retrouvent dans toutes les publications d’intelligence artificielle médicale. Il est donc important de savoir ce qu'ils recoupent pour comprendre les paragraphes méthodologie des articles scientifiques médicaux. 

 

Les 3 phases de l'apprentissage machine

Le but de l'apprentissage machine est d'apprendre à un système informatique à réaliser une tâche. Quelques exemples réussis en médecine sont la reconnaissance de mélanomes sur des photographie de lésions dermatologiques, de métastases de cancer du sein sur des coupes anatomo-pathologiques de curages ganglionnaires ou encore le diagnostic de tumeurs cérébrales sur des scanners. 

 

Pour entraîner une machine, il est nécessaire de partir d'une base de données. Si l'objectif est, par exemple, de configurer un algorithme de diagnostic automatique de mélanomes, on utilisera comme base de données une bibliothèque de photographies, déjà enregistrées et déjà étiquetées, de lésions dermatologiques. 

La base de données va être divisée en 3 parties inégales qui vont, chacune, être utilisées dans 3 étapes successives et distinctes du processus d'apprentissage machine:  entraînement, validation et test. 

 

Entraînement, validation et test

En anglais; training, validation et test

Entraînement. Un échantillon, le plus important - 60 à 75% des données lui sont réservées- est utilisé pour l’entraînement, c’est à dire la création de l’algorithme.  C'est dans cette phase que la machine "apprend" c'est-à-dire qu'elle compose un algorithme qui permettra d'exécuter la tâche demandée: par exemple, reconnaître les mélanomes au sein du jeu de photographies de lésions dermatologiques.  

Une fois cette phase terminée, il restera à vérifier que l'algorithme fonctionne sur des données inconnues, qu'il est "généralisable". C'est le rôle des phases suivantes qui se feront sur le reste des données qui sont, en quelque sorte, mises à part pour tester l’algorithme. 

 

Validation. On soumet donc l’algorithme à un jeu données qu’il ne connaît pas. Le but de cette phase est de repérer les erreurs et de les corriger.

Reprenons l’exemple du système entraîné à reconnaître des mélanomes sur des photographies. A l’issue de la phase d’entraînement, on confronte l’algorithme au  jeu de validation qui, rappelons le, est composé d’images qu’il ne connaît pas. Ce jeu comprend des images de mélanomes et des images autres ( normales, autres tumeurs etc..). Lorsque, sur ce jeu inconnu, le système va se tromper, on le corrige en lui indiquant la bonne réponse. La machine modifie son algorithme en conséquence.

Cette phase de réglage est indispensable pour obtenir un algorithme performant. Mais elle comporte elle-même un risque, celui du « surajustement » ou overfitting en anglais. Cela signifie que l’algorithme s’est trop adapté à sa base de données et a du mal à généraliser. Ceci peut se produire si l’échantillon de validation n’est pas suffisamment représentatif de la population générale, ce qui est le cas si le nombre de données est trop petit. 

L’une des façons de contourner ce problème est de créer un 3e échantillon dit de test. 

 

Test. L’algorithme corrigé au cours de la phase de validation est soumis à ce 3e échantillon. Si l’algorithme est capable de donner de bonnes réponses sur ce jeu de données inconnues pour lui, on dit qu’il est généralisable. 

Son aventure dans le monde réel peut alors commencer…

 

LES MACHINES APPRENNENT-ELLES VRAIMENT? 

Cette question est au cœur du débat de société entourant l'intelligence artificielle. En réalité, les machines n’apprennent pas au sens humain du terme. Les actions qu'elles effectuent sont le résultat de calculs mathématiques. L'intelligence artificielle aboutit certes à des actions automatisées qui miment celles du cerveau humain mais il n'existe pas de processus conscient sous-jacent. La machine "intelligente" ne fait que manipuler des données connues, préalablement enregistrées. Elle ne "pense" pas et ne crée pas de concept nouveau. Elle peut aider à le faire, mais n'en produit pas par elle-même.

Pour reprendre l'expression de Christophe Tricot dans l'article cité en référence ci-dessous:  "les machines calculent mais n'apprennent pas". 

 

 

Quelques sources documentaires

 

Sur le machine learning:

Référence video: 

Intervention de Alexia Audevart  à l'occasion du salon de la data à Nantes en 2017.  L'auteure a de remarquables qualités pédagogiques. Cette présentation est peut être la plus claire de toutes celles que j'ai vues. Vous ne perdrez pas les 45 min que vous passerez à la visualiser. 

 

Référence bibliographiques:

Citons 2 ouvrages, l'un en français, l'autre en anglais, tous 2 remarquables par leur clarté et leurs qualités didactiques. 

Jean-Claude Heudin: Manuel de survie en intelligence artificielle.

 

En langue anglaise: John Paul Mueller and Luca Massaron. Machine Learning for dummies. 

 

 

Sur le thème : les machines apprennent -elles vraiment?

Citons l'article de Christophe Tricot, paru en janvier 2018 dans le journal L'Usine Nouvelle

https://www.usinenouvelle.com/article/tribune-les-machines-n-apprennent-pas.N642748

 

 

LES AUTRES ARTICLES DU LEXIQUE:

 

LEXIQUE DE L'IA EN SANTE : QU'EST-CE QUE L'INTELLIGENCE ARTIFICIELLE?

 

LEXIQUE DE L'IA EN SANTE: QU'EST-CE QU'UN AGENT CONVERSATIONNEL?

 

 

 

 

 

 



30/09/2018
1 Poster un commentaire

Inscrivez-vous au site

Soyez prévenu par email des prochaines mises à jour

Rejoignez les 17 autres membres