SynthID l’arme ultime de Google pour détecter à 100% les contenus générés par IA

Date:

La démarcation entre le contenu créé par des humains et celui généré par intelligence artificielle (IA) devient de plus en plus floue. Dans ce contexte, la technologie SynthID représente une innovation majeure. Elle propose des solutions techniques pour watermarker et identifier les contenus produits par IA, essentielles pour instaurer une confiance dans les informations numériques. Cette suite d’outils est actuellement en phase beta et continue d’évoluer pour intégrer une gamme croissante de produits.

Comment fonctionne SynthID ?

SynthID utilise une diversité de modèles d’apprentissage profond et d’algorithmes pour l’insertion de watermarks invisibles mais détectables dans les contenus générés par IA, qu’ils soient textuels, musicaux, visuels ou vidéo. Le processus se décompose en deux phases principales : le watermarking et l’identification.

Le watermarking consiste à intégrer un filigrane numérique directement dans le contenu généré par IA, sans altérer le contenu original. L’identification permet ensuite de scanner les images, l’audio, les textes ou les vidéos pour détecter ces filigranes, aidant ainsi les utilisateurs à déterminer si le contenu, ou une partie de celui-ci, a été généré par les outils IA de Google.

SynthID pour le texte généré par IA

L’expansion de SynthID pour inclure le watermarking et l’identification de textes générés par IA est notable. Le défi consistait à trouver une solution robuste pour watermarker le texte généré par IA sans compromettre la qualité, la précision et la sortie créative. La solution développée implique d’embedder un watermark directement dans le processus utilisé par un modèle de langage de grande taille (LLM) pour générer du texte.

Un LLM génère du texte token par token, ces tokens pouvant représenter un caractère, un mot ou une partie de phrase. Pour créer une séquence de texte cohérente, le modèle prédit le token le plus probable à suivre. Ces prédictions sont basées sur les mots précédents et les scores de probabilité attribués à chaque token potentiel.

SynthID ajuste le score de probabilité des tokens générés par le LLM. Ce processus est répété à travers le texte généré, de sorte qu’une seule phrase peut contenir dix scores de probabilité ajustés ou plus, et une page peut en contenir des centaines. Le motif final des choix de mots du modèle combiné avec les scores de probabilité ajustés constitue le filigrane. Cette technique peut être utilisée pour aussi peu que trois phrases et sa robustesse ainsi que sa précision augmentent avec la longueur du texte.

SynthID pour la musique générée par IA

En novembre 2023, SynthID a été étendu pour watermarker et identifier la musique et l’audio générés par IA. La première utilisation de SynthID a été faite avec Lyria, notre modèle de génération de musique IA le plus avancé à ce jour, et tous les audios générés par IA publiés par notre modèle Lyria sont dotés d’un watermark SynthID intégré directement dans leur forme d’onde.

SynthID ajoute un watermark numérique à l’audio généré par IA qui est imperceptible à l’oreille humaine. D’abord, SynthID convertit l’onde audio, une représentation unidimensionnelle du son, en un spectrogramme. Cette visualisation bidimensionnelle montre comment le spectre des fréquences dans un son évolue dans le temps.

Une fois le spectrogramme calculé, le watermark numérique y est ajouté. Ensuite, le spectrogramme est reconverti en forme d’onde. Durant cette étape de conversion, SynthID exploite les propriétés audio pour garantir que le watermark reste inaudible, préservant ainsi l’expérience d’écoute.

SynthID pour les images et vidéos générées par IA

SynthID intègre un watermark numérique qui est imperceptible à l’œil humain directement dans les pixels d’une image générée par IA ou dans chaque cadre d’une vidéo générée par IA. Cette technologie permet au watermark de rester détectable, même après des modifications telles que le recadrage, l’ajout de filtres, les changements de couleurs, les modifications de taux de trame (pour les vidéos) et l’enregistrement avec divers schémas de compression avec perte (communément utilisés pour les images JPEG).

Disponibilité de SynthID

Cette technologie est disponible pour les clients de Vertex AI utilisant nos modèles de génération d’images textuelles, Imagen 3 et Imagen 2, qui créent des images de haute qualité dans une grande variété de styles artistiques. La technologie SynthID est également utilisée pour watermarker les sorties d’image sur ImageFX.

SynthID est aussi intégré dans Veo, le modèle de génération vidéo le plus capable à ce jour, qui est disponible pour certains créateurs sur VideoFX. SynthID peut également scanner une seule image, ou les cadres individuels d’une vidéo pour détecter le watermarking numérique. Les utilisateurs peuvent identifier si une image, ou une partie de celle-ci, a été générée par les outils IA de Google grâce à la fonctionnalité “À propos de cette image” dans la recherche Google ou Chrome.

Notre site est un média approuvé par Google Actualité.

Ajoutez Media24.fr dans votre liste de favoris pour ne manquer aucune news !

Nous rejoindre en un clic
Suivre-Media24.fr

Eric GARLETTI
Eric GARLETTIhttps://www.eric-garletti.fr/
Je suis curieux, défenseur de l'environnement et assez geek au quotidien. De formation scientifique, j'ai complété ma formation par un master en marketing digital qui me permet d'aborder de très nombreux sujets.

LAISSER UN COMMENTAIRE

S'il vous plaît entrez votre commentaire!
S'il vous plaît entrez votre nom ici

Articles connexes

Airbus : Icelandair dévoile l’A321LR, un géant éco-responsable

Icelandair, basée à Keflavik, s'est récemment dotée de son premier avion Airbus, l'A321LR. Ce modèle inaugure la modernisation...

Italie : Janvier 2025, l’assurance risques climatiques pour les entreprises devient obligatoire

Face à la recrudescence des catastrophes naturelles – tempêtes, inondations, tremblements de terre – le gouvernement italien a...

La pollution sonore sous-marine tue les baleines et les dauphins directement ou indirectement

La pollution sonore d'origine humaine dans les océans met en péril les baleines et les dauphins. Des explosions...

Ce pays pourtant interdit de centrale nucléaire sur son propre sol depuis 40 ans souhaite développer des réacteurs en France et au Royaume-Uni

Un réacteur nucléaire italien avec un design innovant en évaluation au Royaume-Uni. Newcleo, une start-up italienne dans l'énergie et...