1 00:00:05,800 --> 00:00:08,410 Comme je vous le disais tout à l’heure, l’année dernière, dans le cadre 2 00:00:08,610 --> 00:00:11,290 du cours Enjeux et éthique du numérique, nous avons dédié un 3 00:00:11,490 --> 00:00:16,090 cours à l’intelligence artificielle et nous avons vu ensemble ses principes 4 00:00:16,290 --> 00:00:20,290 de fonctionnement et comment elle avait chamboulé des pans entiers 5 00:00:21,220 --> 00:00:25,210 de l’économie, de la science, de la production de connaissance, 6 00:00:25,410 --> 00:00:26,170 etc. 7 00:00:26,740 --> 00:00:30,010 Ce que je ne vous ai pas dit à l’époque, c’est que cette intelligence 8 00:00:30,210 --> 00:00:32,200 artificielle a une histoire. 9 00:00:32,680 --> 00:00:34,660 Elle est beaucoup moins récente que ce que l’on pense. 10 00:00:35,140 --> 00:00:38,800 Elle est même contemporaine de la naissance de l’informatique 11 00:00:39,000 --> 00:00:39,760 dans les années 40. 12 00:00:40,120 --> 00:00:44,080 Mais pendant de longues décennies, elle est restée dans l’oubli avant 13 00:00:44,280 --> 00:00:47,830 de connaître une résurgence dans les années 80 et de s’imposer à 14 00:00:48,030 --> 00:00:51,580 la fin des années 2010, comme on le sait aujourd’hui. 15 00:00:52,840 --> 00:00:55,680 Je vais vous raconter cette histoire pour que vous en saisissiez les enjeux. 16 00:00:55,880 --> 00:01:00,070 Mais avant cela, je voudrais vous faire un petit rappel en vous rappelant 17 00:01:00,270 --> 00:01:07,810 que ce qu’on appelle l’intelligence artificielle, ce sont plus généralement 18 00:01:08,260 --> 00:01:12,280 des techniques prédictives, des techniques prédictives basées 19 00:01:12,480 --> 00:01:17,140 sur ce qu’on appelle l’apprentissage artificiel, le machine learning, 20 00:01:17,830 --> 00:01:21,250 et plus spécifiquement sur le fonctionnement de réseaux de neurones, 21 00:01:21,850 --> 00:01:22,900 le deep learning. 22 00:01:23,890 --> 00:01:25,950 Vous n’avez rien compris, ce n’est pas très grave, 23 00:01:26,150 --> 00:01:29,110 Je vais vous expliquer un peu plus concrètement. 24 00:01:29,680 --> 00:01:32,590 Si on veut comprendre ce qu’est l’intelligence artificielle, 25 00:01:32,860 --> 00:01:35,980 il faut d’abord comprendre comment fonctionne l’informatique 26 00:01:36,180 --> 00:01:40,150 traditionnelle qui est celle des ordinateurs que nous utilisons 27 00:01:40,350 --> 00:01:41,110 au quotidien. 28 00:01:41,500 --> 00:01:44,110 Il faut comprendre, comme je vous l’ai dit dans la première partie 29 00:01:44,310 --> 00:01:48,820 de ce cours, que la logique de l’informatique, c’est de décomposer 30 00:01:49,450 --> 00:01:54,370 des calculs très complexes en une suite d’instructions basiques qui 31 00:01:54,570 --> 00:01:58,300 peuvent être automatisées et prises en charge par une machine. 32 00:01:58,500 --> 00:02:02,500 C’était le principe de la machine de Turing qui a été automatisé 33 00:02:02,700 --> 00:02:03,460 par la suite. 34 00:02:03,660 --> 00:02:07,060 L’informatique telle qu’on l’utilise, telle qu’on la connaît aujourd’hui, 35 00:02:07,510 --> 00:02:10,810 est dite symbolique, symbolique parce qu’elle répond 36 00:02:11,010 --> 00:02:12,040 à une logique formelle. 37 00:02:12,480 --> 00:02:16,060 Une logique formelle, ça veut dire qu’on peut très bien 38 00:02:16,260 --> 00:02:19,780 décrire et même écrire le raisonnement d’un ordinateur. 39 00:02:20,080 --> 00:02:24,190 On peut écrire le raisonnement d’un algorithme, on peut l’expliquer, 40 00:02:24,390 --> 00:02:28,840 le décrypter, tout simplement parce qu’un ordinateur, un programme 41 00:02:29,410 --> 00:02:31,660 est toujours programmé par un être humain. 42 00:02:32,110 --> 00:02:35,800 Le programme d’un logiciel est écrit par des êtres humains qui 43 00:02:36,000 --> 00:02:39,250 lui donnent des instructions, un peu à la manière d’une recette 44 00:02:39,450 --> 00:02:40,210 de cuisine. 45 00:02:40,410 --> 00:02:43,810 On demande à un programme de réaliser telle tâche, puis telle tâche et 46 00:02:44,010 --> 00:02:46,510 si telle tâche est réalisée, alors l’emmener vers une autre, 47 00:02:46,710 --> 00:02:47,470 etc. 48 00:02:48,340 --> 00:02:52,180 On lui donne des instructions qu’on code dans un programme informatique. 49 00:02:53,200 --> 00:02:56,410 Les réseaux de neurones sur lesquels repose l’intelligence artificielle 50 00:02:56,650 --> 00:02:58,930 fonctionnent sur un principe totalement différent. 51 00:02:59,500 --> 00:03:03,550 L’idée du deep learning et du machine learning, c’est à l’inverse que 52 00:03:04,090 --> 00:03:07,510 les programmes apprennent par eux-mêmes, qui ne soient pas programmés 53 00:03:07,710 --> 00:03:08,620 par des êtres humains. 54 00:03:09,250 --> 00:03:15,280 Autrement dit, on demande à ces machines d’obtenir un résultat 55 00:03:15,670 --> 00:03:19,540 et on les laisse décider par elles-mêmes comment elles vont 56 00:03:19,740 --> 00:03:21,760 parvenir à ce résultat. 57 00:03:21,960 --> 00:03:22,720 Comment ? 58 00:03:22,960 --> 00:03:26,770 En s’entraînant sur d’énormes bases de données. 59 00:03:27,220 --> 00:03:30,190 Il n’y a donc pas d’instructions données à l’utilisateur. 60 00:03:30,390 --> 00:03:33,250 On fait tourner ces réseaux de neurones sur de grandes bases de 61 00:03:33,450 --> 00:03:36,820 données et ils vont apprendre d’eux-mêmes, par exemple à reconnaître 62 00:03:37,020 --> 00:03:41,740 des images, à traduire automatiquement une langue, à reconnaître des mots 63 00:03:41,940 --> 00:03:44,560 interdits qui vont être utilisés par exemple pour la modération 64 00:03:44,800 --> 00:03:46,540 sur les réseaux sociaux. 65 00:03:47,770 --> 00:03:51,490 Si je voulais vous donner une image, si je reviens sur l’image des recettes 66 00:03:51,690 --> 00:03:54,100 de cuisine, l’informatique traditionnelle, c’est suivre une 67 00:03:54,300 --> 00:03:55,060 recette. 68 00:03:55,260 --> 00:03:57,310 Vous avez vos données, vos ingrédients pour faire un 69 00:03:57,510 --> 00:03:58,270 quatre-quarts. 70 00:03:58,470 --> 00:04:01,660 Vous avez des œufs, du lait, du sucre, du beurre et vous suivez 71 00:04:01,860 --> 00:04:02,620 la recette. 72 00:04:02,820 --> 00:04:06,810 Vous suivez les instructions pour parvenir finalement au résultat final, 73 00:04:07,010 --> 00:04:07,770 votre quatre-quarts. 74 00:04:08,320 --> 00:04:10,720 Un outil d’intelligence artificielle, ne fonctionne pas comme ça. 75 00:04:11,170 --> 00:04:14,800 On lui donne les données, on lui donne les ingrédients, 76 00:04:15,000 --> 00:04:18,760 on lui dit : "Fais-moi un quatre-quarts", et on lui demande 77 00:04:18,960 --> 00:04:20,210 d’apprendre par lui-même à le faire. 78 00:04:20,410 --> 00:04:21,170 Comment ? 79 00:04:21,370 --> 00:04:25,300 Tout simplement en apprenant des milliers de recettes qu’il va scanner 80 00:04:25,500 --> 00:04:29,350 pour essayer d’identifier comment on peut parvenir à un tel résultat. 81 00:04:29,550 --> 00:04:36,420 J’espère que cette image aura apporté un peu de clarté dans mon propos. 82 00:04:36,620 --> 00:04:39,190 En tout cas, ce qu’il faut retenir pour l’instant, c’est que la logique 83 00:04:39,390 --> 00:04:42,130 de l’intelligence artificielle, c’est de laisser les programmes 84 00:04:42,330 --> 00:04:44,230 apprendre par eux-mêmes, à réaliser des tâches complexes. 85 00:04:44,430 --> 00:04:48,460 C’est ça qu’on appelle le deep learning et c’est pour cela qu’on 86 00:04:48,660 --> 00:04:49,720 parle d’intelligence. 87 00:04:51,430 --> 00:04:54,040 Le point de départ de cette approche est très ancien. 88 00:04:54,670 --> 00:04:59,350 On retrouve son origine dans un article scientifique publié en 1943, 89 00:04:59,800 --> 00:05:05,350 dans lequel des auteurs proposent de modéliser mathématiquement un 90 00:05:05,550 --> 00:05:06,820 réseau de neurones humains. 91 00:05:08,560 --> 00:05:11,920 Cet article est fondateur parce qu’il va inspirer de nombreux 92 00:05:12,120 --> 00:05:16,330 ingénieurs qui vont essayer de développer des machines prédictives 93 00:05:16,960 --> 00:05:18,580 capables d’apprendre d’elles-mêmes. 94 00:05:20,290 --> 00:05:24,880 Une des premières machines développée à cette époque, un des premiers 95 00:05:25,180 --> 00:05:28,480 dispositifs développés à cette époque, qui a recours à l’intelligence 96 00:05:28,680 --> 00:05:34,360 artificielle, est un programme développé en 1948 par Norbert Wiener, 97 00:05:36,010 --> 00:05:41,200 qui est le père fondateur de la cybernétique, un dispositif prédictif 98 00:05:41,680 --> 00:05:44,260 appliqué au guidage des missiles. 99 00:05:45,430 --> 00:05:52,960 La grande innovation de Norbert Wiener est d’être capable de mettre 100 00:05:53,160 --> 00:05:57,790 à jour, plus exactement que le programme se mette à jour lui-même 101 00:05:58,600 --> 00:06:01,960 en fonction des trajectoires des missiles. 102 00:06:02,620 --> 00:06:04,300 Je vous explique pour être un peu plus clair. 103 00:06:05,140 --> 00:06:09,160 Norbert Wiener développe un guidage de missiles anti-aérien, 104 00:06:09,360 --> 00:06:12,640 c’est-à-dire sur le sol américain, avoir des missiles capables 105 00:06:12,850 --> 00:06:17,440 d’intercepter d’autres missiles si le territoire américain est attaqué. 106 00:06:17,980 --> 00:06:21,550 Mais pour ce faire, il faut être capable de calculer la trajectoire 107 00:06:21,750 --> 00:06:25,390 du premier missile, ce qui est déjà assez compliqué en fonction 108 00:06:25,590 --> 00:06:29,320 de sa masse, de sa vitesse et d’autres paramètres. 109 00:06:29,950 --> 00:06:34,330 Par ailleurs, une fois que le missile antiaérien est envoyé pour intercepter 110 00:06:34,530 --> 00:06:39,040 le premier, sa trajectoire va être influencée par de nombreuses autres 111 00:06:39,240 --> 00:06:42,280 données qui ne peuvent pas être prédites en amont, comme la force 112 00:06:42,480 --> 00:06:45,130 du vent et d’autres conditions climatiques. 113 00:06:45,940 --> 00:06:49,930 La grande force du dispositif de Wiener, c’est que la trajectoire 114 00:06:50,130 --> 00:06:55,390 du missile puisse être mise à jour en temps réel en fonction de ces 115 00:06:55,590 --> 00:06:56,350 données externes. 116 00:06:56,980 --> 00:07:01,360 Mais pour que cela soit possible, il faut que le programme intègre 117 00:07:02,800 --> 00:07:06,520 ces données externes en direct, intègre des feedback, 118 00:07:06,720 --> 00:07:13,150 comme nous l’explique Norbert Wiener, et corrige sa trajectoire en temps 119 00:07:13,350 --> 00:07:14,110 réel. 120 00:07:15,190 --> 00:07:18,660 Ce que développe Norbert Wiener, c’est un système qui est adaptatif. 121 00:07:18,860 --> 00:07:23,710 C’est une machine qui est autocorrective, qui est capable 122 00:07:23,910 --> 00:07:28,300 de modifier ses finalités en fonction des données produites en temps réel. 123 00:07:28,510 --> 00:07:31,240 Autrement dit, c’est une machine qui apprend. 124 00:07:31,990 --> 00:07:34,240 Cette machine apprend, est adaptative. 125 00:07:34,440 --> 00:07:37,480 C’est pour ça qu’elle relève de l’intelligence artificielle. 126 00:07:37,680 --> 00:07:43,990 Pourtant, malgré quelques résultats prometteurs, les approches de 127 00:07:44,190 --> 00:07:47,080 l’intelligence artificielle vont rapidement tomber dans l’oubli 128 00:07:47,440 --> 00:07:51,220 au cours des années 50 et 60, tout simplement parce que les approches 129 00:07:51,420 --> 00:07:54,100 de la logique formelle, d’une informatique formelle 130 00:07:54,300 --> 00:07:57,820 concurrente, vont être beaucoup plus rapides et efficaces. 131 00:07:58,120 --> 00:08:03,610 Programmer des programmes s’avère beaucoup plus efficace à court 132 00:08:03,810 --> 00:08:06,880 terme que développer des machines qui apprennent d’elles-mêmes. 133 00:08:07,720 --> 00:08:12,700 Un autre problème auquel se heurtent les promoteurs de l’intelligence 134 00:08:12,900 --> 00:08:16,270 artificielle, c’est qu’à l’époque, dans les années 40 et 50, 135 00:08:16,540 --> 00:08:20,520 ils ne disposent pas de bases de données suffisantes pour être capable 136 00:08:21,280 --> 00:08:26,860 d’entraîner des machines à apprendre par elles-mêmes, ce qui va constituer, 137 00:08:27,060 --> 00:08:31,270 jusqu’aux années 2010, un problème majeur de l’intelligence 138 00:08:31,470 --> 00:08:33,610 artificielle, je vais y revenir tout de suite. 139 00:08:35,560 --> 00:08:41,980 Il faudra attendre les années 80 pour voir apparaître les premières 140 00:08:42,180 --> 00:08:45,160 applications concrètes de l’intelligence artificielle, 141 00:08:45,610 --> 00:08:49,720 avec notamment les travaux du Français Norbert Wiener , qui est aujourd’hui 142 00:08:49,920 --> 00:08:52,750 directeur de l’intelligence artificielle du groupe Meta, 143 00:08:53,050 --> 00:08:54,610 qui possède Facebook et Instagram. 144 00:08:55,330 --> 00:09:00,160 Yann Lecun, dans les années 80, va développer un outil qui permet 145 00:09:00,430 --> 00:09:06,220 de reconnaître automatiquement les codes postaux et il va vendre 146 00:09:06,420 --> 00:09:11,500 son outil à la poste américaine 147 00:09:12,610 --> 00:09:16,420 afin que le courrier puisse être trié de manière automatique. 148 00:09:16,900 --> 00:09:18,160 En gros, qu’est-ce que fait Yann Lecun ? 149 00:09:18,790 --> 00:09:24,670 Il va entraîner ces algorithmes sur une base de données qui comprend 150 00:09:25,120 --> 00:09:30,670 9 000 chiffres, 9 000 codes postaux qui sont sur les enveloppes des 151 00:09:30,870 --> 00:09:34,570 courriers, afin de reconnaître le tracé d’un 9, d’un 8, 152 00:09:34,770 --> 00:09:38,320 d’un 1, suivant les différents types d’écriture humaine qui sont 153 00:09:38,520 --> 00:09:39,280 très différents. 154 00:09:40,150 --> 00:09:42,130 Avec une petite base de données, puisque 9 000 chiffres, 155 00:09:42,330 --> 00:09:45,430 c’est une toute petite base de données en intelligence artificielle, 156 00:09:45,700 --> 00:09:49,090 il arrive quand même à développer un outil qui permet de reconnaître 157 00:09:49,290 --> 00:09:52,300 automatiquement ces codes postaux, donc de trier beaucoup plus 158 00:09:52,500 --> 00:09:53,680 efficacement le courrier. 159 00:09:54,700 --> 00:09:58,780 Cette machine, ce principe, c’est encore celui qui est utilisé 160 00:09:58,980 --> 00:10:01,780 aujourd’hui dans la plupart des postes du monde pour reconnaître 161 00:10:02,500 --> 00:10:04,150 automatiquement les codes postaux. 162 00:10:04,350 --> 00:10:09,940 C’est aussi la machine qui est 163 00:10:10,140 --> 00:10:16,660 utilisée lorsque vous allez remettre un chèque dans un guichet automatique, 164 00:10:16,860 --> 00:10:20,950 qui va reconnaître automatiquement les numéros qui sont inscrits sur 165 00:10:21,150 --> 00:10:21,910 le chèque. 166 00:10:22,900 --> 00:10:28,540 Pour autant, malgré ce premier succès, il faudra attendre les années 2010 167 00:10:28,900 --> 00:10:33,280 pour connaître une explosion du recours à l’intelligence artificielle. 168 00:10:33,480 --> 00:10:34,240 Pourquoi ? 169 00:10:34,810 --> 00:10:40,390 Parce qu’avec la numérisation du monde, nous allons produire énormément 170 00:10:40,590 --> 00:10:45,880 de données numériques qui vont pouvoir être utilisées par ces 171 00:10:46,080 --> 00:10:48,970 outils d’intelligence artificielle pour s’entraîner. 172 00:10:51,550 --> 00:10:55,150 Les compagnies qui développent de grands services Web, 173 00:10:55,660 --> 00:11:00,430 comme Facebook, Google, AT & T, Baidu en Chine, 174 00:11:01,390 --> 00:11:06,670 ces grands acteurs de l’économie numérique vont avoir des problématiques 175 00:11:06,870 --> 00:11:10,270 sur lesquelles ils pourraient avoir besoin d’avoir recours à l’intelligence 176 00:11:10,470 --> 00:11:18,220 artificielle, comme créer des filtres à spams en s’inspirant des millions 177 00:11:18,420 --> 00:11:21,430 de spams dont ils disposent déjà pour apprendre à les reconnaître. 178 00:11:21,970 --> 00:11:25,360 Ou alors pour les réseaux sociaux, pour modérer automatiquement les 179 00:11:25,560 --> 00:11:29,470 contenus des internautes à partir des millions de messages qui ont 180 00:11:29,670 --> 00:11:32,530 déjà été retirés par des modérateurs humains. 181 00:11:33,430 --> 00:11:36,550 Vous voyez l’idée, à partir du moment où on a des bases de données 182 00:11:36,750 --> 00:11:39,820 suffisantes pour que des outils d’intelligence artificielle 183 00:11:40,090 --> 00:11:47,260 s’entraînent, on va pouvoir commencer à leur trouver des débouchés beaucoup 184 00:11:47,460 --> 00:11:49,750 plus nombreux qu’auparavant. 185 00:11:50,920 --> 00:11:54,700 Je vous parlais de Yann Lecun avec sa base de 9 000 chiffres pour 186 00:11:54,900 --> 00:11:55,750 la Poste américaine. 187 00:11:55,950 --> 00:11:59,350 Aujourd’hui, les bases de données sur lesquelles s’entraîne l’IA 188 00:11:59,740 --> 00:12:03,280 comportent des millions, voire des dizaines ou des centaines 189 00:12:03,580 --> 00:12:04,810 de millions de données. 190 00:12:06,730 --> 00:12:09,790 La traduction automatique que vous utilisez peut-être lorsque vous 191 00:12:09,990 --> 00:12:14,050 utilisez Google Translate ou la modération à laquelle vous êtes 192 00:12:14,250 --> 00:12:17,170 confronté lorsque vous utilisez les réseaux sociaux ou la 193 00:12:17,370 --> 00:12:20,500 reconnaissance d’image automatique sur Google Image par exemple, 194 00:12:20,710 --> 00:12:24,340 reposent toutes aujourd’hui sur des outils d’intelligence artificielle. 195 00:12:24,730 --> 00:12:27,130 Ce qu’il faut retenir, c’est que ces outils, 196 00:12:27,630 --> 00:12:30,760 qui paraissent très novateurs aujourd’hui, ont une histoire très 197 00:12:30,960 --> 00:12:35,560 ancienne et qui remonte aux débuts de l’informatique, qui a connu 198 00:12:35,760 --> 00:12:38,800 une histoire parallèle à celle de l’histoire de l’informatique 199 00:12:39,000 --> 00:12:42,340 symbolique dont je vous ai parlé dans les deux premières séquences. 200 00:12:42,970 --> 00:12:46,840 Elle s’est développée plus lentement parce qu’elle avait moins de données 201 00:12:47,040 --> 00:12:50,650 sur lesquelles s’entraîner, mais aussi parce qu’elle a reçu 202 00:12:50,850 --> 00:12:54,220 moins de soutien de la part des pouvoirs publics et des entreprises, 203 00:12:54,420 --> 00:12:58,000 des industriels qui ont beaucoup investi sur les solutions à court 204 00:12:58,200 --> 00:13:02,740 terme que permettait l’informatique symbolique, l’informatique formelle. 205 00:13:05,350 --> 00:13:10,270 Dans ce cours, nous nous sommes concentrés sur la dimension technique 206 00:13:10,470 --> 00:13:13,270 de l’histoire de l’informatique et peut-être que parfois cela a 207 00:13:13,470 --> 00:13:18,910 été un peu difficile pour vous à suivre, avec des termes très techniques 208 00:13:19,810 --> 00:13:24,010 parfois assez difficiles à comprendre, même si j’essaye au maximum de 209 00:13:24,210 --> 00:13:25,030 vous les simplifier. 210 00:13:25,840 --> 00:13:29,590 Je vous rassure en vous disant que dans ce cours, il y aura des 211 00:13:29,790 --> 00:13:33,100 séquences techniques parfois parce qu’elles sont importantes et 212 00:13:33,300 --> 00:13:36,430 nécessaires, mais il y aura aussi beaucoup d’histoire sociale, 213 00:13:36,640 --> 00:13:38,620 économique et culturelle de l’informatique. 214 00:13:39,070 --> 00:13:42,850 Dans le prochain cours, par exemple, nous allons aborder 215 00:13:43,050 --> 00:13:46,180 la manière dont cette informatique est sortie des laboratoires des 216 00:13:46,380 --> 00:13:49,480 grandes universités pour partir à la conquête de la société, 217 00:13:49,750 --> 00:13:53,320 à la conquête des entreprises, puis des foyers, en faisant une 218 00:13:53,520 --> 00:13:55,840 histoire un peu plus sociale et économique justement, 219 00:13:58,030 --> 00:13:58,960 de l’informatique. 220 00:13:59,500 --> 00:14:06,280 Ce qu’il faut retenir de ce premier cours, c’est que l’informatique 221 00:14:06,480 --> 00:14:12,100 repose sur une logique particulière qui repose sur l’automatisation 222 00:14:12,300 --> 00:14:13,690 de cette logique par des machines. 223 00:14:13,890 --> 00:14:17,950 Il faut retenir que le rôle de l’électronique a été déterminant 224 00:14:18,150 --> 00:14:22,060 dans le développement de ces machines et que l’augmentation de la puissance 225 00:14:22,260 --> 00:14:26,020 de calcul, que nous avons connue ces dernières décennies, 226 00:14:26,220 --> 00:14:30,490 repose en grande partie sur la miniaturisation des composants.