La société Meta, autrefois connue sous le nom de Facebook, a présenté sa dernière innovation en matière d’intelligence artificielle (IA) : SeamlessM4T. Il s’agit du premier modèle linguistique de traduction tout-en-un et multimodal.
🔥 The new SeamlessM4T models from @MetaAI are now available on Hugging Face! 👇 https://t.co/8fwscJkeuB https://t.co/qnhri9d2yK
— Hugging Face (@huggingface) August 22, 2023
Capable de lire des textes à l’oral dans 100 langues et d’en traduire du texte vers du texte dans presque autant, il se distingue par son vaste champ d’action et sa flexibilité.
Un modèle multimodal pour des traductions variées
Le modèle SeamlessM4T est décrit comme multimodal, ce qui signifie qu’il peut traduire aussi bien le texte que la parole et reconnaître automatiquement la langue parlée. Ainsi, il offre différentes possibilités de traduction :
- De la parole à texte
- De la parole à parole
- Du texte à parole
- Du texte à texte
Ces fonctionnalités font de SeamlessM4T un outil unique et très complet pour permettre aux personnes parlant différentes langues de communiquer efficacement et en temps réel.
Les technologies derrière SeamlessM4T
Une combinaison de projets de traduction automatique
SeamlessM4T résulte de l’assemblage des technologies issues de plusieurs projets de traduction automatique menés par Meta depuis des années. Cette fusion permet au modèle d’être aussi performant et polyvalent qu’il l’est aujourd’hui.
SeamlessAlign : un nouvel ensemble de données de traduction
Pour renforcer les capacités de SeamlessM4T, Meta a également développé un nouvel ensemble de données de traduction appelé SeamlessAlign. Il s’agit d’un outil open source qui vient compléter le système en améliorant la qualité des traductions et en permettant une synthèse vocale et une transcription parole-texte plus précises.
Quelles applications pour SeamlessM4T ?
L’amélioration des services existants
Le modèle SeamlessM4T est une avancée majeure dans le domaine de la traduction en temps réel. Il pourrait être utilisé pour améliorer les services de traduction existants sur les plateformes de Meta, comme Facebook, Instagram ou WhatsApp, rendant ainsi la communication entre les utilisateurs parlant différentes langues encore plus aisée.
Les opportunités pour les entreprises et les institutions
Au-delà des applications au sein des plateformes de Meta, SeamlessM4T peut également représenter une véritable opportunité pour les entreprises et les institutions qui souhaitent faciliter les échanges linguistiques entre leurs employés, partenaires ou clients. La disponibilité en open source de certains éléments du modèle pourrait encourager son adoption et son adaptation à des contextes spécifiques.
Un pas de plus vers une IA accessible et universelle
Le lancement de SeamlessM4T témoigne de la volonté de Meta de développer une intelligence artificielle capable de comprendre et de traiter une large gamme de dialectes. En rendant ce modèle multimodal de traduction disponible, la société contribue à faire avancer la recherche et l’innovation dans le domaine de l’IA et ouvre la voie à des applications toujours plus accessibles et universelles pour les utilisateurs du monde entier.