Xiaomi veröffentlicht sein menschenähnliches KI-Stimmenmodell

Diese Woche kündigte Xiaomi einen kühnen Schritt an: Xiaomi-MiMo-Audio, sein Flaggschiff unter den KI-Sprachmodellen, wird offen zugänglich gemacht. Was bedeutet das? Xiaomi-MiMo-Audio wurde für echtes kontextbezogenes Lernen in der Sprache entwickelt – ein Durchbruch, der die Art und Weise, wie KI auf sprachgesteuerten Plattformen verstehen und interagieren kann, verändern wird.

Statt der alten Methode, bei der man in gelabelten Daten ertrinkt, um Ergebnisse zu erhalten, kann Xiaomi-MiMo-Audio mit nur einer Handvoll Beispiele verallgemeinern und sich an neue Aufgaben anpassen. Das erinnert stark an den Wandel, den wir mit Modellen wie GPT-3 im Sprachbereich erlebt haben – nur dass es jetzt für Sprache gilt. Das Modell wurde anhand von Hunderten von Millionen Stunden Audiodaten sorgfältig trainiert und ist dadurch nicht nur in der Lage, Inhalte zu analysieren, sondern auch den Tonfall und die Intention zu verstehen – ein bedeutender Fortschritt für Geschäftsanwendungen und kundenorientierte Produkte.


Xiaomi-MiMo-Audio: Innovation in AI Voice

Was MiMo-Audio von konkurrierenden Lösungen abhebt, ist der technische Sprung im verlustfreien Kompressionstraining, der es dem Modell ermöglicht, eine aufgabenübergreifende Generalisierung im großen Maßstab zu erreichen. In der Praxis bedeutet dies, dass Unternehmen KI-Sprachanwendungen mit drastisch reduzierten Datenanforderungen und viel schnellerem Onboarding für neue Aufgaben und Branchen einsetzen können.

Führend bei Open-Source Generative Speech

Xiaomi ist nicht nur innovativ, sondern gibt auch das Playbook weiter. Das Unternehmen hat nicht nur das Modell selbst, sondern auch seinen Tokenizer, eine neu entwickelte Modellstruktur, fortschrittliche Trainingswerkzeuge und eine Evaluierungssuite zur Verfügung gestellt. Dieser Schritt sollte den Fortschritt im gesamten KI-Sprach-Ökosystem beschleunigen und Entwicklern und Unternehmen den Zugang zu einer ausgereiften, praxiserprobten Technologie ermöglichen, die für individuelle Anwendungsfälle angepasst werden kann.

Für die Implementierung sind die Xiaomi-MiMo-Audio-Modelle für das Vortraining und die Feinabstimmung auf der Huggingface-Plattform zugänglich, wobei der Tokenizer auf GitHub veröffentlicht wird. Das Modell basiert auf einer Transformer-Architektur mit 1,2 Milliarden Parametern, die es sowohl für die Audio-Rekonstruktion als auch für Audio-to-Text-Aufgaben robust macht. Für Unternehmen oder Einzelpersonen, die ihre Geräte verbessern oder die neuesten Funktionen integrieren möchten, sind System-Apps über HyperOSUpdates.com verfügbar. Die MemeOS Enhancer App in Google Play bietet zusätzliche Tools, System-Updates und Early-Access-Funktionen.


Quelle: IT Home

Play Store icon
HyperOS Downloader Easily check if your phone is eligible for HyperOS 3.0 update!
Download icon

Schreibe einen Kommentar

fckk

Umfrage
Which name did you like better, MIUI or HyperOS?