Vous vous souvenez sans doute de ces synthèse vidéo qui nous ont fait penser qu’on ne pourrait plus faire confiance à ce que nous voyons ?
Mais si, souvenez-vous ! Vous avez certainement déjà vu cette vidéo qui colle un discours audio de Barack Obama à des vidéos du même Barack Obama, mais issues d’autres prestations :
Synthesizing Obama: Learning Lip Sync from Audio (2017)
Ou bien encore celle-ci, qui fait faire tout et n’importe quoi aux visages de quelques anonymes et dirigeants de notre monde :
Face2Face: Real-time Face Capture and Reenactment of RGB Videos (CVPR 2016 Oral) (2016)
Bonne nouvelle ! On pourra (probablement) les repérer, à en croire Hany Farid, spécialiste de la manipulation d’images, dans cette entrevue accordée au magazine scientifique Nature.
Parmi les pistes évoquées, chercher dans les images des éléments déjà vus ailleurs, dans la même image ou dans d’autres images, pour déceler les montages. Le procédé est en usage ! En 2008, l’AFP s’était même fait avoir par une retouche photo du lancement de missiles issue d’un organe de propagande iranienne. Les agences analysent désormais prudemment les photographies avant de les transmettre à la presse.
Une autre piste est de constater l’absence de défauts de compression sur les éléments que l’on pense incrustés de manière synthétique, ou encore l’absence de défauts liés à la capture elle-même. En effet, les capteurs numériques sont monochromes, des filtres RGB entrelacés permettent de capturer des couleurs. Les teintes sont entrelacées entre les pixels. La surreprésentation de détails, ou leur incohérence sur certaines portions de l’image peut ainsi trahir sa nature synthétique. Diverses solutions d’analyse d’images suspectes existent, tel le logiciel Tungstène, utilisé par certains experts.
Mais l’astuce probablement la plus spectaculaire du moment renvoie vers une nouvelle piste de recherche : Video Magnification. Ce projet de recherche repère les variations temporelles colorimétriques et des formes présents dans une vidéo pour en calculer les fréquences et en amplifier les amplitudes.
Parmi les applications, on trouvera l’extraction du pouls et de la respiration du sujet filmé. Dans cette présentation, le pouls est détecté par amplification des imperceptibles changements de couleur de la peau des sujets, alors que l’amplification du déplacement de la poitrine permet de déceler la respiration :
Eulerian Video Magnification (2012)
Cet autre projet de recherche obtient des résultats encore plus surprenants, avec, cette fois-ci, la détection du pouls par amplification du mouvement imperceptible de la tête du sujet, balancée au grès des battements du cœur, et ce, y compris lorsque le visage est obstrué par un masque, ou encore que le sujet tourne la tête dans la direction opposée :
Detecting Pulse From Head Motions in Video (2013)
Voilà de quoi se rassurer… un peu ?
Crédit image : Free SVG