banner

Blog

Jul 10, 2023

Lernen Sie Meta SeamlessM4T kennen: Mehrsprachiger Übersetzer

Meta hat gerade ein beeindruckendes neues Tool namens SeamlessM4T veröffentlicht. Dieses schicke KI-Modell kann fast 100 Sprachen transkribieren und übersetzen und ist ein großer Fortschritt dabei, Sprachbarrieren der Vergangenheit anzugehören.

Das Unternehmen behauptet, dass SeamlessM4T, Massively Multilingual and Multimodal Machine Translation, Sprache in Text und Text in Sprache für fast 100 Sprachen umwandeln kann. Es identifiziert 100 Eingabesprachen und wandelt sie in 35 Ausgabesprachen für Speech-to-Speech- und Text-to-Speech-Funktionen um.

Da es unter der Creative Commons CC BY-NC 4.0-Lizenz vertrieben wird, steht es Forschern frei, es zu verbessern. Die Informationen für SeamlessAlign, Teil des offenen Übersetzungsdatensatzes von Meta, wurden auch zusammen mit SeamlessM4T zur Verfügung gestellt. Im Gegensatz zu bestehenden großen Übersetzungsmodellen, die die Übersetzung auf mehrere Systeme aufteilen, erledigt SeamlessM4T laut Meta die gesamte Übersetzungsarbeit in einem einzigen Vorgang, was es zu einem „bedeutenden Durchbruch“ macht.

Wenn SeamlessM4T wie vorgesehen funktioniert, ist einer seiner faszinierenden Aspekte seine angebliche Fähigkeit, Codewechsel oder den Übergang zwischen zwei oder mehr Sprachen innerhalb einer einzigen Phrase zu erkennen. Meta zeigte beispielsweise in einem Video, wie das Modell sofort zwischen Hindi, Telugu und Englisch unterscheiden kann.

Es verfügt über das Potenzial, sofort zu erkennen, wenn ein Sprecher Sprachen durchquert, wie in einem fesselnden Video gezeigt, in dem es mühelos zwischen Hindi, Telugu und Englisch unterschied. Diese Fähigkeit könnte die interkulturelle Kommunikation revolutionieren und eine Welt fördern, in der Sprache kein Hindernis mehr darstellt.

„Im Einklang mit unserem Ansatz der offenen Wissenschaft veröffentlichen wir SeamlessM4T unter einer Forschungslizenz, damit Forscher und Entwickler auf dieser Arbeit aufbauen können. Wir veröffentlichen auch die Metadaten von SeamlessAlign, dem bislang größten offenen multimodalen Übersetzungsdatensatz. Insgesamt wurden 270.000 Stunden Sprach- und Textausrichtungen erfasst“, sagt Meta.

Was ist Lama2?: Metas KI erklärt

Um schlankere Modelle zu erstellen und mehr Informationen zu verwalten, hat Meta nach eigenen Angaben seine Fairseq-Sequenzmodellierungs-Toolbox geändert, um SeamlessM4T zu generieren.

Laut Meta wurde ein System geschaffen, das bei der Erstellung von SeamlessM4T schädliche oder heikle Phrasen erkennen kann. Nach der Definition von Meta sind toxische Wörter solche, deren „Übersetzung zu Hass, Gewalt, Obszönität oder Missbrauch anstacheln kann“. Ziel ist es, Fälle zu identifizieren, in denen durch die Ausgabeübersetzung verursachte Toxizität im Quellinhalt zuvor nicht vorhanden war.

Was ist Lama2?
AKTIE