SynthID l’arme ultime de Google pour détecter à 100% les contenus générés par IA

Date:

La démarcation entre le contenu créé par des humains et celui généré par intelligence artificielle (IA) devient de plus en plus floue. Dans ce contexte, la technologie SynthID représente une innovation majeure. Elle propose des solutions techniques pour watermarker et identifier les contenus produits par IA, essentielles pour instaurer une confiance dans les informations numériques. Cette suite d’outils est actuellement en phase beta et continue d’évoluer pour intégrer une gamme croissante de produits.

Comment fonctionne SynthID ?

SynthID utilise une diversité de modèles d’apprentissage profond et d’algorithmes pour l’insertion de watermarks invisibles mais détectables dans les contenus générés par IA, qu’ils soient textuels, musicaux, visuels ou vidéo. Le processus se décompose en deux phases principales : le watermarking et l’identification.

Le watermarking consiste à intégrer un filigrane numérique directement dans le contenu généré par IA, sans altérer le contenu original. L’identification permet ensuite de scanner les images, l’audio, les textes ou les vidéos pour détecter ces filigranes, aidant ainsi les utilisateurs à déterminer si le contenu, ou une partie de celui-ci, a été généré par les outils IA de Google.

SynthID pour le texte généré par IA

L’expansion de SynthID pour inclure le watermarking et l’identification de textes générés par IA est notable. Le défi consistait à trouver une solution robuste pour watermarker le texte généré par IA sans compromettre la qualité, la précision et la sortie créative. La solution développée implique d’embedder un watermark directement dans le processus utilisé par un modèle de langage de grande taille (LLM) pour générer du texte.

Un LLM génère du texte token par token, ces tokens pouvant représenter un caractère, un mot ou une partie de phrase. Pour créer une séquence de texte cohérente, le modèle prédit le token le plus probable à suivre. Ces prédictions sont basées sur les mots précédents et les scores de probabilité attribués à chaque token potentiel.

SynthID ajuste le score de probabilité des tokens générés par le LLM. Ce processus est répété à travers le texte généré, de sorte qu’une seule phrase peut contenir dix scores de probabilité ajustés ou plus, et une page peut en contenir des centaines. Le motif final des choix de mots du modèle combiné avec les scores de probabilité ajustés constitue le filigrane. Cette technique peut être utilisée pour aussi peu que trois phrases et sa robustesse ainsi que sa précision augmentent avec la longueur du texte.

SynthID pour la musique générée par IA

En novembre 2023, SynthID a été étendu pour watermarker et identifier la musique et l’audio générés par IA. La première utilisation de SynthID a été faite avec Lyria, notre modèle de génération de musique IA le plus avancé à ce jour, et tous les audios générés par IA publiés par notre modèle Lyria sont dotés d’un watermark SynthID intégré directement dans leur forme d’onde.

SynthID ajoute un watermark numérique à l’audio généré par IA qui est imperceptible à l’oreille humaine. D’abord, SynthID convertit l’onde audio, une représentation unidimensionnelle du son, en un spectrogramme. Cette visualisation bidimensionnelle montre comment le spectre des fréquences dans un son évolue dans le temps.

Une fois le spectrogramme calculé, le watermark numérique y est ajouté. Ensuite, le spectrogramme est reconverti en forme d’onde. Durant cette étape de conversion, SynthID exploite les propriétés audio pour garantir que le watermark reste inaudible, préservant ainsi l’expérience d’écoute.

SynthID pour les images et vidéos générées par IA

SynthID intègre un watermark numérique qui est imperceptible à l’œil humain directement dans les pixels d’une image générée par IA ou dans chaque cadre d’une vidéo générée par IA. Cette technologie permet au watermark de rester détectable, même après des modifications telles que le recadrage, l’ajout de filtres, les changements de couleurs, les modifications de taux de trame (pour les vidéos) et l’enregistrement avec divers schémas de compression avec perte (communément utilisés pour les images JPEG).

Disponibilité de SynthID

Cette technologie est disponible pour les clients de Vertex AI utilisant nos modèles de génération d’images textuelles, Imagen 3 et Imagen 2, qui créent des images de haute qualité dans une grande variété de styles artistiques. La technologie SynthID est également utilisée pour watermarker les sorties d’image sur ImageFX.

SynthID est aussi intégré dans Veo, le modèle de génération vidéo le plus capable à ce jour, qui est disponible pour certains créateurs sur VideoFX. SynthID peut également scanner une seule image, ou les cadres individuels d’une vidéo pour détecter le watermarking numérique. Les utilisateurs peuvent identifier si une image, ou une partie de celle-ci, a été générée par les outils IA de Google grâce à la fonctionnalité “À propos de cette image” dans la recherche Google ou Chrome.

Notre site est un média approuvé par Google Actualité.

Ajoutez Media24.fr dans votre liste de favoris pour ne manquer aucune news !

Nous rejoindre en un clic
Suivre-Media24.fr

Eric GARLETTI
Eric GARLETTIhttps://www.eric-garletti.fr/
Je suis curieux, défenseur de l'environnement et assez geek au quotidien. De formation scientifique, j'ai complété ma formation par un master en marketing digital qui me permet d'aborder de très nombreux sujets.

LAISSER UN COMMENTAIRE

S'il vous plaît entrez votre commentaire!
S'il vous plaît entrez votre nom ici

Articles connexes

Biodiversité en danger : la NASA teste des technologies de surveillance inédites

Mesurer et surveiller la biodiversité terrestre et aquatique depuis l'espace est désormais une réalité. Un projet de recherche...

Certaines baleines à fanons échappent aux orques en adoptant un chant ultra-grave

Dans l’immensité des océans, certaines espèces de baleines à fanons ont développé une stratégie acoustique inattendue pour éviter...

2020, une année record de verdissement de la planète observé par satellite, mais que s’est il passé ?

En pleine pandémie, alors que l'activité humaine était au ralenti, la Terre a connu un record de verdissement....

Le Japon est le premier pays au monde à essayer cette technologie nucléaire complexe mais qui a un avantage : elle produit de l’hydrogène

Le Japon lance le premier complexe nucléaire de production d'hydrogène à haute température au monde. Dans un élan novateur...