Deepfakes, deepvoices : comment fonctionnent ces contenus manipulés ?
Apprenez à repérer les deepfakes, ces contenus générés par IA créant de la manipulation et de la désinformation.
Aline Cordier Simonneau 4 min de lecture 
Sommaire
Si la manipulation d’images existe depuis longtemps, les progrès récents de l’IA lui ont en revanche permis de changer d’échelle. Les contenus falsifiés générés par IA se multiplient. Les personnalités publiques (responsables politiques, acteurs, etc.) sont particulièrement exposées, mais les entreprises et les particuliers peuvent également faire l’objet de manipulation de contenus. Comment sont créés les deepfakes ? Quels risques présentent-ils et comment les repérer ? Voici quelques éléments de réponse.
Deepfake, deepvoice : définition
Le mot deepfake est né de la contraction de deep learning et de fake (il est parfois traduit en français par « hypertrucage ». Deepfake désigne un contenu généré par l’intelligence artificielle (« contenu synthétique »), qu’il s’agisse d’une image, d’une vidéo ou encore d’un contenu audio (on parle alors de deepvoice).
Ces contenus manipulés (et rendus réalistes par l’IA) permettent de faire dire n’importe quoi par n’importe qui, de représenter des personnes dans des situations trompeuses ou humiliantes, etc. Le point commun entre tous ces contenus est leur capacité à semer la confusion et à manipuler l’opinion. Parfois choquants, drôles ou déplacés, ces contenus ne laissent pas indifférent et peuvent être partagés en masse sur les réseaux sociaux.
Quels sont les risques liés aux deepfakes ?
Au-delà des risques de désinformation et de propagande, ces contenus permettent de réaliser des usurpations d’identité, aussi bien à l’encontre de particuliers que d’entreprises. Ils peuvent être utilisés pour obtenir des informations sensibles ou pousser certaines personnes à réaliser des actions (manipuler la voix d’un PDG pour pousser un salarié à réaliser un virement frauduleux, par exemple). Un autre usage possible (parmi tant d’autres) est de faire chanter des personnes avec de fausses vidéos pornographiques afin de leur soutirer de l’argent (on parle de « sextorsion »).
Ces contenus truqués étant faciles à créer en masse, ils sont également de plus en plus utilisés dans les cyberattaques. Les entreprises doivent donc apprendre à évoluer avec ces nouveaux risques (en sensibilisant leurs salariés à ce type de contenus, par exemple).
Comment sont créées les deepfakes et deepvoices ?
Ces contenus falsifiés (on parle également de « contenus de synthèse ») sont générés par l’intelligence artificielle et plus précisément par le machine learning, qui s’appuie sur la disponibilité de grandes quantités de données (images, vidéos, fichiers son). De nombreux deepfakes sont créés via la technique des réseaux antagonistes génératifs, qui met en compétition deux algorithmes. Le premier crée des imitations les plus crédibles possibles. De son côté, le second détecte les faux contenus. Les deux algorithmes travaillent jusqu’à ce que le second ne soit plus en mesure de déceler les faux. Autrement dit, jusqu’à ce que les contenus soient suffisamment réalistes pour tromper les utilisateurs. Dit autrement, le machine learning contribue à rendre crédibles des contenus manipulés.
Les récents progrès de l’IA et la facilité d’accès de certains outils font augmenter les contenus deepfake, à la fois en qualité et en volume. Les outils utilisés pour créer des deepfakes sont d’ailleurs désormais accessibles au grand public : FakeApp, Faceswap.dev et Midjourney.com pour les détournements d’images, voice.ai (générateur de voix de synthèse) pour les deepvoices. Et ce ne sont là que quelques exemples. Il est désormais simple de réaliser ce genre de contenus, y compris sans connaissances techniques.
Quelques exemples de deepfakes et deepvoices
Les personnalités publiques sont nombreuses à avoir fait l’objet de deepfakes. En voici quelques exemples :
- Les deepfakes vidéo de Tom Cruise sur TikTok,
- Les fausses photos du pape François en doudoune Balenciaga, réalisées grâce à Midjourney,
- Les images de Donald Trump en pleine interpellation par des policiers,
- Les deepfakes utilisant l’image d’Emma Watson, qu’il s’agisse de photos suggestives ou d’une vidéo la présentant faussement en train de lire Mein Kampf.
Comment déceler ces contenus manipulés ?
Repérer les défauts de ces contenus truqués
Si les contenus générés par IA semblent particulièrement réalistes à première vue, ils contiennent cependant certains défauts qu’il est possible de détecter, par exemple :
- Les yeux ne clignent pas.
- Les mouvements des lèvres ne sont pas (ou mal) synchronisés avec le débit de parole.
- L’éclairage est peu naturel.
- Les mouvements de la bouche sont dénués de naturel.
- Les vues de profil ne sont pas encore au point.
Des outils existent pour détecter les deepfakes. Sensity.ai est l’un d’entre eux.
Faire appel au bon sens et être vigilant
Si les outils de détection de faux contenus progressent, ils ne sont pas infaillibles pour autant. Les systèmes d’authentification par la voix sont par exemple quasiment systématiquement trompés par des deepfakes audio.
En cas de doute, faire appel au bon sens constitue le meilleur des réflexes :
- Le contenu que j’ai sous les yeux est-il vraisemblable ?
- Mon directeur me contacte-t-il habituellement par message vocal pour me demander un virement ?
- Quelle est la source de ce contenu et puis-je lui faire confiance ?
Avoir connaissance de l’existence de ces contenus et de leurs défauts constitue déjà une première étape pour s’en protéger.
Enfin, pour éviter de voir vos images et vos contenus personnels manipulés à des fins malveillantes, limitez vos publications personnelles et soyez stricts dans les autorisations que vous accordez (lorsque vous devez autoriser une application à accéder à vos photos, par exemple). Vérifiez régulièrement quelles sont vos informations personnelles accessibles sur les moteurs de recherche, afin de demander leur déréférencement si besoin.
Risques de manipulation de l’opinion, de propagande ou encore de désinformation… L’Union européenne cherche à poser un cadre juridique pour contrer les dérives de l’intelligence artificielle et imposer des règles de transparence aux IA génératives (ChatGPT et Midjourney en tête). Si les deepfakes sont souvent décriés pour leurs risques de manipulation, ils ne s’y limitent pas pour autant. Ils peuvent d’ailleurs être utilisés à d’autres fins : créer une vidéo d’une personne disparue à partir de photos, recréer le discours d’une personnalité politique (reconstitution de l’appel du 18-Juin par un procédé de voice cloning) ou encore améliorer le quotidien de personnes affectées par des troubles du langage (création de deepfake audio de la voix du patient).


