La démarcation entre le contenu créé par des humains et celui généré par intelligence artificielle (IA) devient de plus en plus floue. Dans ce contexte, la technologie SynthID représente une innovation majeure. Elle propose des solutions techniques pour watermarker et identifier les contenus produits par IA, essentielles pour instaurer une confiance dans les informations numériques. Cette suite d’outils est actuellement en phase beta et continue d’évoluer pour intégrer une gamme croissante de produits.
Comment fonctionne SynthID ?
SynthID utilise une diversité de modèles d’apprentissage profond et d’algorithmes pour l’insertion de watermarks invisibles mais détectables dans les contenus générés par IA, qu’ils soient textuels, musicaux, visuels ou vidéo. Le processus se décompose en deux phases principales : le watermarking et l’identification.
Le watermarking consiste à intégrer un filigrane numérique directement dans le contenu généré par IA, sans altérer le contenu original. L’identification permet ensuite de scanner les images, l’audio, les textes ou les vidéos pour détecter ces filigranes, aidant ainsi les utilisateurs à déterminer si le contenu, ou une partie de celui-ci, a été généré par les outils IA de Google.
SynthID pour le texte généré par IA
L’expansion de SynthID pour inclure le watermarking et l’identification de textes générés par IA est notable. Le défi consistait à trouver une solution robuste pour watermarker le texte généré par IA sans compromettre la qualité, la précision et la sortie créative. La solution développée implique d’embedder un watermark directement dans le processus utilisé par un modèle de langage de grande taille (LLM) pour générer du texte.
Un LLM génère du texte token par token, ces tokens pouvant représenter un caractère, un mot ou une partie de phrase. Pour créer une séquence de texte cohérente, le modèle prédit le token le plus probable à suivre. Ces prédictions sont basées sur les mots précédents et les scores de probabilité attribués à chaque token potentiel.
SynthID ajuste le score de probabilité des tokens générés par le LLM. Ce processus est répété à travers le texte généré, de sorte qu’une seule phrase peut contenir dix scores de probabilité ajustés ou plus, et une page peut en contenir des centaines. Le motif final des choix de mots du modèle combiné avec les scores de probabilité ajustés constitue le filigrane. Cette technique peut être utilisée pour aussi peu que trois phrases et sa robustesse ainsi que sa précision augmentent avec la longueur du texte.
SynthID pour la musique générée par IA
En novembre 2023, SynthID a été étendu pour watermarker et identifier la musique et l’audio générés par IA. La première utilisation de SynthID a été faite avec Lyria, notre modèle de génération de musique IA le plus avancé à ce jour, et tous les audios générés par IA publiés par notre modèle Lyria sont dotés d’un watermark SynthID intégré directement dans leur forme d’onde.
SynthID ajoute un watermark numérique à l’audio généré par IA qui est imperceptible à l’oreille humaine. D’abord, SynthID convertit l’onde audio, une représentation unidimensionnelle du son, en un spectrogramme. Cette visualisation bidimensionnelle montre comment le spectre des fréquences dans un son évolue dans le temps.
Une fois le spectrogramme calculé, le watermark numérique y est ajouté. Ensuite, le spectrogramme est reconverti en forme d’onde. Durant cette étape de conversion, SynthID exploite les propriétés audio pour garantir que le watermark reste inaudible, préservant ainsi l’expérience d’écoute.
SynthID pour les images et vidéos générées par IA
SynthID intègre un watermark numérique qui est imperceptible à l’œil humain directement dans les pixels d’une image générée par IA ou dans chaque cadre d’une vidéo générée par IA. Cette technologie permet au watermark de rester détectable, même après des modifications telles que le recadrage, l’ajout de filtres, les changements de couleurs, les modifications de taux de trame (pour les vidéos) et l’enregistrement avec divers schémas de compression avec perte (communément utilisés pour les images JPEG).
Disponibilité de SynthID
Cette technologie est disponible pour les clients de Vertex AI utilisant nos modèles de génération d’images textuelles, Imagen 3 et Imagen 2, qui créent des images de haute qualité dans une grande variété de styles artistiques. La technologie SynthID est également utilisée pour watermarker les sorties d’image sur ImageFX.
SynthID est aussi intégré dans Veo, le modèle de génération vidéo le plus capable à ce jour, qui est disponible pour certains créateurs sur VideoFX. SynthID peut également scanner une seule image, ou les cadres individuels d’une vidéo pour détecter le watermarking numérique. Les utilisateurs peuvent identifier si une image, ou une partie de celle-ci, a été générée par les outils IA de Google grâce à la fonctionnalité “À propos de cette image” dans la recherche Google ou Chrome.