l'
Intelligence Artificielle : Un tour de la question....par un non spécialiste...en
2014
19/11/2024
Préambule :
L'
IA (Intelligence Artificielle, ou AI ) ne peut pas être qu'une affaire
de
spécialistes, plus même, ne peut être
laissée qu'aux mains de spécialistes. encore faut-il que chacun sache
de quoi on parle ! En effet, tout le monde est concerné, directement ou
indirectement.
Si le présent article peut convaincre de cela, le but de l'auteur est
atteint.
Une
donnée de base : (datée de 2023)
"Définitions
et avis concernant l’IA" , réalisés par
l’institution française CNIL (Centre National Informatique et
Libertés) :
La
CNIL fut créée en
1978 par la loi Informatique et Libertés, la CNIL est une autorité
administrative indépendante, composée d’un Collège de 18 membres et
d’une
équipe d’agents contractuels de l’État.
Sa
position est donc
assez neutre, hors du champ des chercheurs ou des entreprises.
Selon
la CNIL, l’IA n’est pas une technologie, mais une
science qui regroupe diverses techniques informatiques. Voir le
chapitre définitions.
SOMMAIRE
Des Définitions
Aux origines de l'IAL’I A comme
Mémoire Artificielle
L’IA comme
rédacteur de textes
L’IA
Générative
Les
Modèles de fondation (FM).
Les
Modèles d’ Action (LAM).
Le cerveau humain
La grande
révolution économique
L'illusion de l'informatique dans les nuagesL’IA et Cadre
Légistatif
Des Applications de l'IA Générative
Références
Des Définitions :
A-Selon la CNIL, l ’intelligence
artificielle est un procédé logique et automatisé reposant généralement
sur des
algorithmes et en mesure de réaliser des tâches bien définies.
B-Pour le
Parlement européen, constitue une intelligence
artificielle tout outil utilisé par une machine afin de « reproduire
des comportements liés aux humains, tels que le raisonnement, la
planification
et la créativité ». Plus précisément, la Commission
européenne
considère que l’IA regroupe :
- les
approches d’apprentissage automatique (1);
- les
approches fondées sur la logique et les connaissances ; et
- les
approches statistiques, l’ estimation ou inférence bayésienne (2) et
les méthodes de recherche et d’optimisation.
Illustration : parc de
Johan Miro .
(1) L’apprentissage
automatique
(machine
learning en
anglais) est un champ d’étude de l’intelligence artificielle qui vise à
donner
aux machines la capacité d’« apprendre » à partir de
données, via des
modèles mathématiques. Plus précisément, il s’agit du procédé par
lequel les
informations pertinentes sont tirées d’un ensemble de données
d’entraînement.
Le but de cette phase est l’obtention des paramètres d’un modèle qui
atteindront les meilleures
performances, notamment lors de la réalisation de la tâche attribuée au
modèle.
Une fois l’apprentissage réalisé, le modèle pourra ensuite être déployé
en
production.
(2) L’estimation
ou inférence bayésienne
s’appuie sur un théorème énoncé par le mathématicien Thomas Bayes. Ce
théorème
donne une méthode pour calculer la probabilité d’un phénomène grâce à
la
connaissance de certaines informations. L’estimation bayésienne est
donc la
méthode qui s’appuie sur ce raisonnement.
Exemple :
sachant
d’une part que mes chaussures sont peu adhérentes, et d’autre part
qu’il a plu,
le risque de glisser lors de mon trajet au travail ce matin est élevé.
Aux origines de l'I A
Sans remonter aux sources : automates, robots, systèmes experts qui suivent des règles définies.
C'est
dans les années 1980 que deux chercheurs physiciens vont poser les
bases théoriques de ce que l'on appelle maintenant l'IA. John Hopfield,
un américain, avait créé une mémoire capable de stocker et de
reconstruire entre autre des images à partir de données numérisées.
Geoffrey Hinton, un canado-britannique, avait de son côté inventé une
méthode capable, de façon autonome, de trouver des propriétés dans des
données et d'identifier des éléments spécifiques dans des images. Ces
découvertes ont permis de réaliser l'apprentissage automatique via des
réseaux neuronaux artificiels. Ces deux chercheurs ont recu le prix
Nobel de physique en octobre 2024.
A noter que G. Hintonr a manifesté depuis ses inquiétudes sur les évolutions possiblement dangereuses de l'IA.
L’I A comme
Mémoire Artificielle.
Les applications
en IA s’appuient sur des bases de données
souvent gigantesques.
C’est le cas des
moteurs de recherche enrichis par l’IA.
Ils ont à leur
portée les milliards de sites Internet
existants et libres d’accès.
En plus, ils
sont dotés de raisonnement linguistique. Ils
sont donc aptes à repérer dans une requête les mots clés nécessaires à
la
réponse à fournir. Mais leurs algorithmes ne vont plus se contenter de
lister
les pages consultées, ils vont sélectionner les éléments de réponse qui
y sont
contenus.
Ces
éléments,
assemblés, vont être fournis à l’utilisateur
sous une forme qui apparait comme « intelligente ».
Le
procédé de répétition de la question est
utilisé.
En général, les
sites consultés sont référencés en fin de
réponse.
C’est pour cela
que je désigne ce type de système comme des
processus de « Mémoires Artificielles »,
tant ils se
rapprochent du comportement d’une personne extrêmement savante, du type
de
certains autistes dont la mémoire absorbe et restitue tout ce qu’elle a
emmagasiné.
La Mémoire
Artificielle est déjà un assistant formidable pour
les chercheurs et pour certains praticiens. Le diagnostic médical
assisté par
IA n’est pas autre chose. On ne peut parler d’Intelligence. Le système
ne
comprend pas une goutte des réponses fournies, mais il donne une vue
quasi
exhaustive de tous les symptômes décrits dans les bases de données
médicales
auxquelles il a accès.
Les moteuers de recherche
évoluent. Ceux utilisés jusque début des années 2020 intègrent
une
utilisation maximale de l'IA pour le recherche, tous entraînés par la
nouvelle présentation des réponses préssentées initialement par
"CHAT-GPT". Ce qui ne va pas sans poser de gros problèmes : par
exemple, le modèle "Google Search" présentait jusqu'ici les sites
Internet jugés les plus aptes à répondre à la question de l'utilisateur
sous forme de liste. La rentabilité du système résidait dans la
rémunération des sites désireux d'être bien placés dans la liste de
recherche. Chaque "clic" dans un site rapportait à la fois à Google
(rémunération) et intéressait le propriétaire du site (apport
d'informations sur le visiteur, possibilité de le fidéliser, de lui
faire commander des objets ou services.
Donc les nouveaux moteurs de
recherche doivent réinventer la ou les publicités à présenter
en
relation avec une recherche. Intégrer les publicités avec les données
présentes en bases de données. Bref, toute une nouvelle donne !
Tout un nouveau modèle financier.
L’IA comme
rédacteur de textes.
A ce propos Luc
de Brabandere , célèbre ingénieur et
philosophe, écrivait en fin 2023 : « CHAT GPT écrit
comme il calcule,
quoiqu’il calcule très bien, il écrit tout aussi mal. ». Ce
qui veut dire
que l’écriture fournie par un système d’IA n’est pas le résultat de la
pensée,
mais un résultat statistique : le mot, la phrase la plus
probable est
utilisée. On peut aussi craindre « la phrase la plus
acceptable » par
les maîtres du système.
Dans
ce chapitre on peut classer les outils de traduction : ceux existants
se voyent renforcés par l'ajout des possibilités offertes par l'IA.
En
plus, des outils de dialogue interactifs entre locuteurs oraux de
langues différentes apparaissent. Mais leur efficacité pratique reste
encore à prouver.
L’IA Générative
Une
définition :
L'intelligence
artificielle générative (IA générative) est un
type d'IA capable d’apprendre ( Machine learning), de créer de nouveaux
contenus ou développements, notamment des conversations, des histoires,
des
images, des vidéos et de la musique.
L’IA
générative est donc aussi un système capable de prendre des
décisions.
Ainsi
les technologies d'IA génératives tentent d'imiter
l'intelligence humaine dans des tâches informatiques non
traditionnelles telles
que la reconnaissance d'images, le traitement du langage naturel (NLP)
et la
traduction.
L'IA générative est un développement de l'intelligence artificielle.
Elle
est capable d’apprendre le langage humain, les langages de
programmation, l'art, la chimie, la biologie ou tout autre sujet
complexe. Pour
ce faire elle réutilise les données d'entraînement qu’on lui a soumise
et ce pour
résoudre de nouveaux problèmes. Par exemple, elle peut apprendre le
vocabulaire
anglais et ensuite créer un poème à partir des mots qu'elle traite.
Elle
peut améliorer et combiner des photos, remasteriser des
enregistrements, conduire un véhicule en tenant compte des multiples
informations fournies par des capteurs.
Une entreprise peut utiliser l'IA générative à diverses fins, telles
que les
chatbots, la création multimédia ainsi que le développement de
variantes de produits.
Voir le dernier chapitre qui commente des applications.
Comme
toutes les intelligences artificielles, l'IA générative fonctionne en
utilisant
des modèles de « machine learning », de très grands
modèles
pré-entraînés sur de vastes quantités de données.
Les Modèles
de fondation (FM).
Les modèles de
fondation (FM) (1)
sont des modèles de « Machine Learning » entraînés
sur un large éventail de données généralisées et non étiquetées. Ils
sont
capables d'effectuer une grande variété de tâches générales.
Les FM sont
le résultat des
dernières avancées d'une technologie qui évolue depuis des décennies.
En
général, un FM utilise des modèles et des relations appris pour prédire
le
prochain élément d'une séquence.
Par
exemple, lors de la
génération d'images, le modèle analyse l'image et crée une version plus
nette
et plus clairement définie de l'image. De même, dans le cas du texte,
le modèle
prédit le mot suivant dans une chaîne de texte en fonction des mots
précédents
et de leur contexte. Il sélectionne ensuite le mot suivant à l'aide de
techniques de distribution de probabilité.
Formés
sur des ensembles très importants de données,
les modèles de fondation (FM) sont comme de grands réseaux neuronaux,
dits
« deep learning » qui ont changé la façon dont les
spécialistes des
données abordent le machine learning (ML). Plutôt que de développer
l'intelligence artificielle (IA) à partir de zéro, les spécialistes des
données
utilisent un modèle de fondation comme point de départ pour développer
des
modèles de machine learning qui alimentent les nouvelles applications
plus
rapidement et de manière plus rentable.
Le terme « modèle de
fondation» a été inventé par des chercheurs
pour décrire des modèles de machine learning formés sur un large
éventail de
données généralisées et non étiquetées et capables d'effectuer une
grande
variété de tâches générales telles que la compréhension du langage, la
génération de texte et d'images et la conversation en langage naturel.
En
quoi les modèles de fondation sont-ils si particuliers ?
Une
fonctionnalité essentielle des modèles de
fondation est leur adaptabilité. Ces modèles
peuvent effectuer un large
éventail de tâches disparates avec un haut degré de précision en
fonction des
instructions de saisie. Certaines tâches incluent le traitement du
langage
naturel (NLP), la réponse aux questions et la classification des
images. La
taille et la nature polyvalente des FM les différencient des modèles ML
traditionnels, qui exécutent généralement des tâches spécifiques,
telles que
l'analyse du texte en fonction des sentiments, la classification des
images et
la prévision des tendances.
On
peut utiliser des modèles de fondation comme
modèles de base pour développer des applications en aval plus
spécialisées. Ces
modèles sont l'aboutissement de plus d'une décennie de travail qui leur
a
permis d'augmenter en taille et en complexité.
Par
exemple, BERT, est l'un des premiers
modèles de fondation, il a été publié en 2018. BERT,
acronyme
anglais de « Bidirectional Encoder Representations
from
Transformers », est un modèle de langage
développé par Google.
Ce
modèle a permis d'améliorer significativement les performances en
traitement automatique des langues.
Il
a
été formé à l'aide de 340 millions de
paramètres et d'un jeu de données d'entraînement de 16 Go. En
2023, cinq
ans plus tard seulement, l’entreprise US « OpenAI » a
formé son « GPT-4 »
(3) en utilisant 170 billions de paramètres et un jeu de
données de
formation de 45 Go. Selon OpenAI, la puissance
de calcul requise pour la modélisation des fondations a doublé tous
les 3,4 mois depuis 2012. En 2013, les FM, tels
que les grands modèles de langage (LLM) Claude 2 et
Llama 2, et le
modèle Diffusion stable texte-image de Stability AI, peuvent exécuter
d'emblée
une série de tâches couvrant plusieurs domaines, comme la rédaction
d'articles
de blog, la génération d'images, la résolution de problèmes
mathématiques, le
dialogue et la réponse à des questions sur la base d'un document
Des
domaines de fondations très recherchés depuis la grande diffusion de
l'IA sont ceux relatifs à la cybersécurité.
Comme
on le rappelle plus loin dans le texte, les cybercriminels se sont
précipités dans l'utilisation de l'IA pour menet des actions de plus en
plus sophostiquées de piratage de sites internets et de
systèmes
informatiques jusqu'ici assez bien protégés. L'IA se prête ainsi très
bien au forcage de clés de protections même très complexes et permet
aux pirates de s'emparer du contenu de fichiers confidentiels. Un des
leaders du marché des systèmes de cybersécurité sur le "Cloud" est en
2014 la société Crowdstrike avec ses nouveaux outils utilisant l'IA.
La
menace est telle que les responsables de socités de gestion des cartes
de crédit installent de cellues spécialisées en IA pour faire face à
des intrusions dans leurs banques de données, intrusions dont les
conséquences financières seraient catastrophiques.
(3)
GPT = Generative Pre trained
Transformer
ChatGPT = dialogue interactif sous forme de « chatbot» entre
l’utilisateur
et le système d’IA GPT développé par OpenAI.
Les Modèles
d’Action (LAM).
C’est
une évolution des FM (modèles de fondation).
Les « Large Action Models » LAM. Ils permettent de
prendre des
actions et d’apprendre sur base de la répétition de ces actions. Ils
sont
intéressants car ils permettent de refaire une série d’actions sur base
de la
répétition de cette série d’actions par leur modèle.
Ils
peuvent agir tant dans un univers virtuel (actions sur un PC par
exemple) que
dans un univers réel via des connections à des objets
Par
exemple, sur un simple appel par le nom d’un fichier, en prendre une
copie
temporaire de sécurité, mettre à jour ses propriétés, puis l’ouvrir, en
modifier la date de dernière version, et positionner le curseur en
début de
texte.
Dans
un monde réel, sont appelés à répéter sur commande ce que l’humain
réalise dans
telle ou telle circonstance donnée.
Cela
existe déjà en 2023 : « Rabbit OS », une
couche logicielle qui
se rajoute à des applications web classiques et qui
« apprend »
suivant les comportements de l’utilisateur.
Ils peuvent par exemple doter un robot laveur de vitres de manière
telle que
celui-ci réplique tout le circuit et les manipulations effectuées par
l’humain
pour un immeuble donné, y compris des situations inattendues :
fenêtre
ouverte, volet extérieur non levé, etc.
Mieux,
ils peuvent agir et réagir avec autonomie dans des contextes
dangereux :
incendies, milieux radioactifs ou exposés à des rayonnements cosmiques.
Comme
ces sortes d’IA ont un caractère agissant et une mobilité dans un
univers réel,
il sera évident de s’assurer qu’ils comprennent bien ce que l’humain
veut leur faire
faire. On voit aussi toutes les
dérives que cela pourrait entrainer.
Les
modèles d’action révolutionnent notre environnement.
En
très peu de temps, (2012 à 2015) des applications nouvelles se
présentent :
On
a parlé de multimédia :
Des
anciens films, des anciens enregistrements de TV, peuvent être
rapidement
corrigés, rafrîchis, et
malheureusement
aussi corrigés ou modifiés.
Des
systèmes de vidéosurveillance qui existaient déjà disposent maintenant
d’outils
d’analyse sophistiqués basés sur L’IA.
Les
jeux olympiques de Paris en juillet 2014 en voient une application sur
une très large échelle. Toutes les images captées par des
milliers de
caméras sont
analysées afin de repérer tout mouvement de foule ou d’objet
caractérisé comme
« suspect ». Chaque séquence suspecte est alors
isolée, datée et
géographiquement située aux fins d’être soumise aux contrôleurs…encore
humains 😊. La
reconnaissance faciale serait possible.
Appliquée déjà sur une large échelle en Chine et à Singapour.
Les
outils classiques de correction ou manipulation des photos et vidéos
vont
se simplifier considérablement. Un « Photoshop » à
portée de tous
s’est annoncé en avril 2024 : Samsung annonçait à cette date
son Galaxy
S24 doté de la fonction « AI Photo Assist »
ChatGPT4
est annoncé aussi à cette date avec un outil qui permet d’imiter la
voix de
n’importe
quelle personne, pourvu que ce soit dans la même langue. Mais cette
société est
consciente des grands dangers que cette application porte en elle côté
sécurité.
Sa
diffusion reste encore restreinte. Elle ouvre encore une nouvelle porte
aux
cybercriminels !
Le cerveau
humain sera-t-il dès
lors inutile à brève
échéance ?
L’IA a une
capacité de gestion des données infiniment plus
large et rapide que le celle du cerveau humain.
Il n’en reste
pas moins que l’IA n’a aucune conscience de ce
qu’il réalise.
Sa créativité
reste dépendante de son apprentissage, et comme
toute application informatique, elle contient des
« bugs » qui ne
sont détectés que par le hasard des circonstances.
Les applications
de l’IA sont dépendantes de la connexion à
de très gros systèmes, de plus en plus puissants et de mémoires de plus
en plus
phénoménales.
Ce point est développé au chapitre "Révolution économique".
Les Systèmes IA
vont-ils remplacer les humains ?
Dans un article
intéressant écrit par les professeurs Bruno
Colmant et Nicolas van Zeebroek en janvier 2024, ces derniers affirment
que ce
fait est incontestable et va dans le prolongement de ce qu’a déjà fait
l’informatique. Une grande partie de la main d’œuvre industrielle est
amenée à
disparaitre. L’autre partie sera consacrée soit à la conception de
nouveaux
systèmes, soit à alimenter en données nouvelles les bases de données
sur
lesquelles s’appuient les systèmes d’IA. En effet, un système IA peut
apprendre
par lui-même à enrichir ses données et son expérience dans le ou les
domaines
pour lesquels il a été conçu. Exemple de domaine : les cancers
des voies
digestives en Amérique du Nord. Mais il ne va pas passer de lui-même au
domaine
des cancers du cerveau dans le même périmètre géographique.
Et pour passer à
une autre région géographique, une nouvelle
logique et de nouvelles données doivent être disponibles.
De plus, les
résultats proposés par un système et surtout les
actions significatives qui en découlent doivent être
validées par un
être
humain.
Imagine-t-on un
système décidant par lui-même d’interrompre
le traitement d’un cancer du côlon jugé par lui en phase
irréversible ?
Pourrions-nous
accepter que ce soit le système lui-même qui annonce au patient qu'il
est atteint d'une maladie grave ? Que le système lui fournisse ses
statistiques de survie ?
Ce qui est vrai dans le domaine de la santé
peut être vrai dans d'autres domaines. En économie, par
exemple,
des systèmes proposent déjà des solutions de gestion des portefeuilles
titres.
De là à les gérer eux-même il n'y a qu'un pas. Et comme tous
les systèmes décisionels suivent environ les mêmes algorithmes, dont la
logique échappe aux utilisateurs, on peut immaginer les étranglements
boursiers que cela peut représenter, et les paniques des marchés
financiers que cela peut générer.
Tout
cela n'empêche pas le patron de Open-AI, Sam Altman, de se fixer un
objectif à terme : un système technologique capable de réaliser toutes
les fonctions propres à celles du cerveau humain, et donc de devenir un
être conscient ! Cet objectif apparait en 2014 comme illusoire au vu de
l'endettement énorme que sa société affiche déjà, car l'avancement des
recherches en matière d'IA coûte des fortunes qui s'évaluent en
milliards de $ !
LLM et LQM
Dans les systèmes d'IA, on peut distinguer :
Les LLM ou "Large Langage Models",
qui sont des modèles de fondation destinés à répondre aux
interrogations des utilisateurs, à ses demandes d'actions, en
dialogant avec lui dans le langage choisi par l'utilisateur.
Les LQM ou "Large Quantitative Models"
qui veulent aller plus loin. Ils se basent aussi sur de larges
ensembles de données, mais utilisent des "primitives" ou "algorithmes"
qui simulent au mieux des comportements du monde réel. Ils suivent non
pas des processus statistiques.
Roald
Sieberath attirait récemment l'attention, dans une de ses chroniques,
sur le fait que les "Large Language Models" disponibles actuellement
restent de formidables outils dont les réponses peuvent être qualifiées
de"statistiques", car se basant sur d'énormes quantités de données.
Mais ces outils ne raisonnent pas, puisqu'ils ne comprenent pas les
réponses qu'ils donnent !
Une
question du style "Que fairel
si..." risque fort de recevoir une réponse à côté de la question ou pire, absurde. Exemple : quand je
reverse le contenu du bol de l'oeuf que j'y ai versé dans sa
coquille, combien de temps faudra-t-il pour
cuire cet oeuf en dur ? Donner une réponse intelligente à cette
question aux limites de l'absurde par ordinateur nécessite des
contrôles de vraisemblance qu'un humain réalise bien plus facilement
qu'une machine. Toutefois Open-AI s'est fixé pour objectif de donner
des réponses "intelligentes" dans la majorité des cas. Inverstit des
sommes considérables en 2024 sur une version "Io".
Roald
Sieberath signalait aussi le projet de "World Labs", Cofondée par la
célèbre professeure à Standford Fei-Fei Li. Elle avait créé la base
ImageNet qui permit le bond en avant de la vision
par l'IA.
Son projet actuel est de doter l'IA générative d'une représentation
propre du monde qui l'entoure. Cela doterais des systèmes d'IA
d'une véritable intelligence, à tout le moins lui éviterait des
réponses erronées, vagues ou inadaptées.
De l'utilité de "traducteurs" d'IA.
Traducteur d'IA est
un mot utilisé pour désigner thème cher à une grande spécialiste belge en IA : Notre
société a besoin de personnes pour construire des ponts entre des
mondes
aux préoccupations différentes, par exemple les autorités
administratives, les services juridiques, les experts techniques. Un
développement d'appilication IA est ou devrait être le résultat de la
collaboration d'équipes multidisciplinaires.
Exemple de remplacement de l'humain dans le domaine des arts picturaux :
Selon
le professeur à l'école polytechnique de UCLouvain, Axel Legay, c'est
grâce à la création de "jumeaux numériques" et à ses possibilités de
"deep learnings" que l'IA se révèle très précisuese dans le champ des
beaux -arts. Elle collecte une grande quantité de données relatives à
des oeuvres d'art, que l'on nomme des 'features". Ces données
permettent à des équipes pluridisciplinaires de concevoir des
algorithmes spécifiques qui établissent une série de caractéristiques
comme le style, les formes, les volumes, les couleurs, les coups
de pinceaux. Les jumeux numériques (images virtuelles créées à
l'identique aux mod§les, ceci sur base d'images photographiques en 2 ou
3 D prises avec des filtres divers et sous des angles divers)
permettent de guider le chercheur pour détecter les zones abîmées d'une
oeuvre, proposer les matériaux à utiliiser pour en permettre une
restauration éventuelle. Restauration qui peut être simulée avant toute
action effective !
On est donc arrivé à un stade d'analyse qui
dépasse celui du spécialiste ! Mais le sens critique de l'humain reste
indispensable avant toute action. Et l'action de restauration elle-même
ne sera souvent pas entreprise pour ne pas toucher au patrimoine. Mais
l'IA aura apporté une meilleure connaissance de l'état initial du
tableau. L'analyse faite permet de détecter leds "features" relatifs
aux oeuvress d'un même peintre. La détaction de faux en est
facilitée....jusqu'au jour où la même IA pourra aider un faussaire à
créer lui-même un faux. Ce qui ne va pas manquer de se réaliser très
vite pour des oeuvres vendues de manière virtuelle.
La grande
révolution économique.
Des auteurs
attirent l’attention sur le fait que trop
de revenus des Etats
sont encore basés sur les revenus du travail. Or
de moins
en moins de gens travailleront ; donc il faut trouver des
ressources parmi
les bénéficiaires de l’automatisation galopante de la
société ! Sans quoi
comment assurer la survie des chômeurs et la retraite des
gens ?
Ce sont là de
grandes questions politiques à résoudre le plus
rapidement possible.
Une
autre révolution économique se précise en fin 2013. Elle est d'ordre
technologique.
Le succès des applications IA a entrainé une demande
accrue de cartes de type graphique à haute performance, spécialité de
la firme NVIDIA. Il y a un mouvement double : du côté de l'usage des
modèles , leur augmentation monte en flèche. Il y a des efforts pour
augmenter la puissance des serveurs d'IA et il y a des efforts pour
optimiser les recherches lancées par les utilisateurs.
Mais du côté
des dévelopements de modèles, de leur mise au point et de leur
entraînement, les besoins en puissance informatique devienent
colossaux, au point de nécessiiter la création de nouveaux et
gigantesques "Data Center" de la part des acteurs comme
Microsoft, OpenAI, Google et autres.
Caractéristique : ce n'est plus la
capacité mémoire qui est une limite, c'est la puissance informatique.
Et qui dit puissance, dit consommation en ressorces énergétiques et
matériaux rares. La course est lancée...où s'arrêtera-t-elle ?
Autre interrogation : y
aura-t-il usage des ordinateurs
quantiques pour la conception ou la gestion des
applications en IA ?
On
sait leur énorme potentiel en la matière, mais aussi leur coût et leur
impact énergétique dû à la nécessité de fonctionnement du coeur à des
températures proches du zéro absolu.
Bref, ces faits
vont en plus à
l’encontre de la recherche d’économies
d’énergie.
Il faut voir
aussi que plus ces Méga-Centres sont utilisés dans les
pratiques industrielles et administratives, plus ceux-ci sont
dépendants de la
bonne gestion et maintenance des systèmes d'IA et de leurs
réseaux informatiques et de
leur
alimentation énergétique.
Cette inter-dépendance
devient un facteur économique non négligeable. Il met l'Europe en
situation difficile de ce point de vue.
La photo
: Data Center géant prévu par Google
en Artique.
Un
autre aspect de l'inter-dépendance est encore récemment
souligné par
Nicolas Petit, un spécialiste des questions IA. Il soulignait, lors
d'une conférence en mai 2024, le fait que l'IA générative exige des
investissements énormes pour dévellopper et tester les modèles IA
générative. Cela place un seuil de taille très élévé en terme de fonds
propres et capitaux disponibles pour les entreprises dominant ce marché.
Pour
preuve : le pdg de "Alphabet" , maison mère de Google, déclarait le 29
avril 2024 que sa société se réorganisait profondément pour améliorer
toutes ses fonctions et produits en IA. Un appel de fonds de l'ordre du
milliard de $ est fait en bourse !
Du côté de la Chine, une chose
est certaine : l'Etat investit énormément pour ne pas être en reste vis
à vis des sociétés US dominantes. La Russie s'intéresse plutôt à
l'utilisation de l'IA à des fins de propagande et d'influence. Les
autres régions du monde risquent de marquer de sérieux retards.
Dans
un rapport d'audit
daté de début 2024, la Cour des Comptes Europénne (CCE) s'adresse à la
Commission européenne en disant qu'il n'y aura pas de progrès possible
en IA européenne "sans
une gouvernance renforcée et sans
investissements à la fois plus importants et plus ciblés".
La CCE estime qu'en début 2024, l'Europe accuse déjà un retrad
d'investissement de plus de 10 milliards d'€ par rapport aux USA !
Les grands acteurs en IA
en 2014 :
côté US :
OpenAI, créateur ea de Chat-GPT
Anthropic
Microsoft, (qui a un accord avec OpenAI) outils Copilot et
Chat-GPT
Google outil Gemini
Apple
outil AI (Apple Intelligence)
Meta qui a démarré un peu en retard. outil Meta AI
côté Corée ;
Samsung adopte l'outil Gemini
L'Europe ne peut subsister dans cet environnement ultra financé que par la création d'outils IA plus ciblés. Une réalisation : Mistral
Le défi économique pour les fournisseurs d'IA.
Il
se pose dans les termes suivants : Les investissements en matériels et
ressouces humaines sont énormes et croissent exponetiellement. Les
revenus ne sont pas "encore" à la hauteur des dépenses encourues :
abonnements, vente de données. Le recours aux actions et obligations
est massif et rencontre un gros succès. Mais une bulle spéculative ne
serait-elle pas en trains de se créer en cette fin 2024 ?
L'illusion de l'Informatique - et donc de l'IA- dans les nuages.
Il
semble souvent utile de rappeller que tous les services informatiques
qui nous sont servis via le WI-FI, l'informatique dans les nuages (cloud somputing), et donc les services en IA, ne sont
guère dématérialisés que sur la courte distance qui sépare le poste de
travail de l'utilisateur du modem WI-FI installé par son
distributeur de télécommunication.
Au delà, quasi tous les signaux transitent par câbles. C'est le cas de 99 % du trafic mondial de données !
Les
câbles en question sont de plus en plus souvent de nature optique. Ils
relient le ou le modem WI-FI à l'ordinateur "serveur" le plus proche, lequel appartient au fournisseur de service.
Et de ce serveur rayonnent des câbles de et vers d'autres serveurs.
Pour
les liaisons grandes distances, pour les liaisons inter-continentales,
ce sont des câbles sous-marins qui sont utilisés. Les mêmes qui servent
aussi à des transferts d'énergie électrique.
Sur ce sujet, on peut consulter entre-autre un excellent article dans https://fr.wikipedia.org/wiki/C%C3%A2ble_sous-marin
La "toile" ou "le net" sont donc bien des objets tangibles et physiques !
Les
multiples satellites qui entourent la terre servent,
eux, essentiellement à des communications du type radio-téléphonie,
moins gourmandes en densité de données.
Toutes
les données qui transitent via les serveurs sont recues, traitées et
leurs réponses envoyées par des systèmes abrités dans des "Data
Centers"
géants. Ce sont de très grands systèmes bien physiquement présents,
comme vu au
chapitre précédent "interdépendance". Et désservis par des humains.
Au
niveau de l'
interdépendance, sujet traité au chapitre précédent, soulignons que les
câbles appartiennent en grande majorité à des entreprises de grandes
puissances mondiales. Leur installation, leur maintenace dépendent
d'eux. Et ils constituent des "maillons faibles" dans le développement
futur de l'IA. La rupture d'un ou deux maillons (rupture de câble) ne
pose pas de gros problème au trafic de données, mais au delà, des
régions entières du globe peuvent se trouver isolées d'autres régions.
Les navires spéciaux destinés à l'installation et la maintenance de
câbles constituent des cibles stratégiques !
A
signaler : démarré en 2014, l'installation du câble "datas" dénommé
Medusa. De plus de 8.000 km, il est destiné à l'interconnexion des pays
de la Méditérannée. Ce projet est mené par un consortium européen.
La photo : section d'un câble sous-marin multi-usage. 2015, alamyimages.fr
L'IA et un Cadre
Législatif.
L’énorme puissance d’information, mais aussi de
désinformation qui se révèle avec les applications de l’IA n’échappe
pas aux
sociologues, ni aux politologues.
C’est
ainsi qu’en première mondiale, le 15 mars
2024, le Parlement Européen a voté, à l’unanimité de ses membres, l’IA
Act.
Il s’agit d’un puissant cadre légal destiné à enrayer les dérives des
applications de l’IA, et de favoriser, par ce fait même, l’éclosion
d’une
industrie européenne mise tant soit peu en mesure de lutter contre des
faux en
tous genres.
Il est par exemple interdit de diffuser des images crées ou modifiées
par IA sans que mention explicite en soit faite. Pire, que de fausses
voix puissent être créées et prêtées à des personages filmés afin de le
faire dire du faux !
A noter aussi que les autorités de la concurrence, tant américaines qu'
européennes veillent particili§rement à ce que les "GAFAs" ne prennet
le controle de grandes "start-up" en IA, créant ainsi des
superpuissances dominat le marché des applications IA.
On ne manquera pas de signaler aussi l'énorme puissance que
L'IA apporte ou peut apporter au biaisage de l'information.
Par exemple, les principaux outils d'IA sont détenus par des sociétés
américaines (Les GAFA 's) ou chinoises.
Qui
peut garantir que les algorithmes de recherche ne soient pas
biaisés en faveur de thèses défendues par les patrons de ces
sociétés ? Personne. Mais en plus, aucun cadre législatif
particulier n'interdit encore de telles pratiques. L'Europe seule vient
de voter une loi en ce sens.
Microsoft
lui-même a attiré l'attention sur la nécessité de développer des
applications capables de détecter si un texte, une image, un "Podcast"
a été produit par IA.
Des applications de l'IA générative.
Une remarque s'impose d'abord :
Le marketing de produits nous fait confondre IA Générative et Robotique basée sur l'IA.
La
robotique utilise les capacités d'apprentissage propres à l'IA afin
d'apprendre et mémoriser les données nécessaires à l'exécution d'une
tâche donnée. Tâche que le robot exécutera ensuite en autonome, en
tenant compte des contraintes apprises. Un bon exemple à portée de tous est le robot
tondeur de pelouse. Il apprend à connaitre son terrain d'action sous
direction humaine. Il en mémorise les coordonnées "GPS". Il
apprend à éviter certains obstacles, à en contourner d'autres,
même inattendus, mis sur son passage.
Mais il ne peut pas être plongé dans contexte, une "question", quelque peu différente sans "reprogrammation".
Quelques domaines d'applications de l'IA générative.
L'encyclopédie. C'est un des premiers et des plus vaste domaine
offert à L'IA. Sujet déjà abordé. Quoique la fourniture d'informations
ne soit pas "générative" en elle-même, sa mise en forme
conversationelle l'est bien. Les réponses fournies dépendent fort
de la précision des questions posées. Il ne faut pas perdre de vue que
les ouvrages qui pouraient répondre aux questions posées ne sont pas
nécessairement cités. Ce sera la cas si leur contenu n'a pas été publié
sur un site Internet et leur titre n'invite pas à répondre à la question posée.
L'enseignement
: L'IA devient un assitant des professeurs et des élèves.
Il met en cause la rédaction des "mémoires" car elle est capable
d'en rédiger elle même. Evidemment il y a des limites. Et sans action
intelligente de l'utilisateur, tous les mémoires ont des contenus
semblables car le "big data" est le même pour tous !
Il faudra aussi
que l'enseignement couvre l'aspect du comment rédiger une
question et comment avoir un regrd critique sur les réponses données.
¨lus que jamais, les références aux réponses fournies seront à
rechercher. Ces références, c'est ce qui fait la valeur de
l'encyclopédie en ligne "Wikipédia".
La médecine
assitée par l'IA. Les médecins ont de plus en plus besoin d'assistant
médical : le nombre de pathologies à traiter ne fait qu'aumenter !
Le
secrétariat de direction en entreprise publique ou privée. Après
la disparition du secrérarit chargé de la rédaction de lettres et
documents divers, le secrétariat de direction va-t-il disparaitre, lui
aussi remplacé par le tenue centralisée des agendas, par la rédaction
de rapports de réunions, surtout si ceux-ci ont eu lieu en
téléconférence ? Par la rédaction automatique de comptes et bilans ?
Le marketing est
un domaine privilégié pour tout ce qui concerne les études de
consommation, les études de réactions clients réels ou potentiels,
l'analyse et la synthèse des enquêtes.
Son danger réside dans le
potentiel partage de profils utilisateurs, profils qui échapent aux
dits utilisateurs, puisque ce ne sont que des profils déductifs de
données qu'ils ont fournies volontairement ou pas.
Il existe aussi
un risque accru d'uniformisation des produits proposés par les
entreprises. L'IA générique ne pousse pas à l'innovation à partir de
données existantes.
L'assistance à distance
pour l' utilisation de produits et services. Ce qui est connu comme
"Chat-Box" pour les services vente et après-vente, ou en remplacement
de manuels en ligne.
Le revers de la médaille est que les entreprises et administrations ne
se reposent plus que sur les outils de ce type pour aider leurs
clients. Cela creuse alors encore plus l'écart numérique qui sépare le
société civile.
A noter aussi que se reposer entièrement sur une application
intelligente pour répondre aux questions posées part du principe qu'il
existe une réponse à tout. Ce qui n'est pas et ne sera jamais le cas,
d'autant que certaine questions sont mal posées. Sans recours possible
à un interlocuteur humain, il y a alors échec de la communication.
La gestion automatisée des patrimoines
client en banque ? Cela existe déjà, n'est conseillé que pour des
avoirs peu importants. Car cette gestion, si elle tient compte d'un
profil clinet très affûté, ne tient compte que du passé et du présent
des données disponibles. Seul un humain peut "pressentir" des
tendances. Exemple ; si une maladie touche les boeufs en Argentine,
cela peut-il avoir des conséquences sur la navigation dans le détroit
du Panama, et donc...
En plus, ici encore plus qu'ailleurs,
l'utilisateur, et même le banquier, ignore le raisonnement suivi par la
machine dans ses recommandations. Des "biais" peuvent l'influencer.
L'automobile.
Déjà en application pour des voitures ou transports sans pilotes, l'IA
pose cependant encore bien des questions quant à son usage généralisé.
Mais son utilité s'avère incontestable là où les itinéraires sont bien
balisés. Moins visibles, mais bien plus utiles, des outils basés sur
l'IA générative assurent une régularisation et une fluidification
du trafic dès qu'un réseau suffisant de capteurs a été mis en place.
L'aviation. L'IA
pourra-t-elle remplacer le co-pilote obligatoire sur les avions de
ligne ? Sans doute, si l'on résoud l'aspect sécurité : l'avion ne peut
dépendre d'une IA installée quelque-part dans le "cloud". L'IA peut
aussi s'avérer un assitant précieux dans la gestion du traffic aérien.
Les arts.
Domaine sans limite, par définition. On peut faire de l'art avec
tout...ou en faire faire ! Et comme la définition de ce qui est "art"
est totalement floue, la question ne se pose même pas ! Mais il reste
un gros point noir : la copie ou la contre-facon, grandement facilitée
par les outils siimples offerts par Chat-GPT et d'autres. Voir ce qui en a déjà été dit au chapitre "remplacement de l'humain".
L'informatique,
et tout spécialement la programmation.L'IA générative est désormais
capable de produire des programmes dans différents langages. Ce fait
bouleverse la manière dont sont développés les logiciels. Le métier de
programmeur disparait complètement, mais pas celui de concepteur,
ni le travail important de vérification et coordination.
La surveillance et la sécurité des
personnes dans l'espace public. On en a déjà parlé de la vidéosurveillance. Ici les possibilités de scaning rapide
de millions d'images saisies lors de rassemblements dépassent de loin
toutes possibilités humaines. Avec les risques connus
d'empiéter sur les libertés individuelles.
L'assistance aux agents en immobilier.
Quels agents ? les syndics d'immeubles, surtout dans leurs tâches de
proposition et accompagnement de rénovations d'immeubles en
multipropriétés ; les courtiers et régisseurs de biens immobiliers. Ces
agents ont à prendre connaissance d'une multitude de
données cadastrales, de règlements en matière de sécurité,
d'environnement, d'isolation et même parfois de techniques
vernaculaires (propres à une région). Or beaucoup de ces données sont
déjà présentes dans des bases de données dipersées.
La rédaction de textes. Il ne s'agit pas ici de génération de textes autour d'un sujet proposé par l'utilisateur.
Ik
s'agit d'assister le rédacteur de textes à différents niveaux :
orthographe et grammaire, bien sûr, mais surtout détection de
redondances, de phrases incorrectes en fournissant en plus des
propositions pour remplacer des mots, des phrases plus adaptées au
contexte. Le logiciel peut aussi proposer à la demande un texte plus
synthétique, ou effacer des effets de genre. Le pionnier dans ce type
de logiciel est "Antidote" de la société québecoise "Druide", société
active dans ce domaine depuis 1993 et qui utilise maintenant à
fond les ressources de l'IA générative.
Les armes et la guerre. Effarant ! Tout développement de ce paragraphe s'avère inutile.
Références.
"Homme
versus Machine, l'IA démystifiée" par Geertrui Mieke De Ketelaere.
https://www.cnil.fr/fr/intelligence-artificielle/intelligence-artificielle-de-quoi-parle-t-on
https://aws.amazon.com/fr/what-is/generative-ai/
https://Wikipedia.org
https://datascientest.com/intelligence-artificielle-definition#:~:text=Une%20intelligence%20artificielle%20ou%20IA%2C%20est%20un%20programme,artificielle%20a%20%C3%A9t%C3%A9%20acc%C3%A9l%C3%A9r%C3%A9%20par%20le%20big%20data.
Articles
« Digital demain » de Roald Sieberath,
professeur et président de « Digital Wallonia ».
Parutions de Nicolas Bataille, consultant au sein de l'ILIA.
Nouvelles diverses
En avril 2024, le
groupe META de M. Zickelberg annonce la disponibilité de tous
ses propres outils basés sur l'IA.
Début
mai 2024, Tim Crook, patron de Apple, présente la nouvelle tablette
IPad PRO dotée d'outil IA Générative. Un visuel fait scandale dans le
milieu artistique, où l'on voit livres, peinture, piano, mannequin,
appareil photo, sculpture lentement écrasés pour faire place à iPad PRO.
La publicité en question a été retirée, car le message devait être
"stimuler la créativité" et non la remplacer.
De fait, CHATGPT permet déjà de produire des livres, des biographies en
un temps record.
Mais de l'avis des lecteurs avertis, ces ouvrages se révèlent d'une
grande platitude et comportent inévitablement des erreurs dues aux
sources puisées.
Entre
la région Wallone, Microsoft et Proximus il existe un partenariat ,
dénommé MIC, qui vise à accélérer l'adoption de l'IA dans les PME
wallones. Il envisage aussi d'augmenter les compétences disponibles en
la matière. Un plan a été dévoilé en mai 2024.
www.mic-belgique.be
Retour au sommaire