
FFmpeg 8.0 fügt OpenAI Whisper Filter für automatische Spracherkennung ein
Die kommende Version der FFmpeg 8.0 Multimedia-Bibliothek wird von Tag zu Tag spannender. Die neueste Funktion, die in diese nächste Version gequetscht wird, ist ein Whisper-Audio-Filter für die Nutzung von OpenAIs Whisper-Modell für die Bereitstellung automatischer Spracherkennung / Transkription Fähigkeiten.
Eine Übersetzung von 🇬🇧 Phoronix.com
Für diejenigen, die es nicht wissen: Whisper ist ein automatisches Spracherkennungsmodell, das auf einem sehr großen Datensatz trainiert wurde und sich als äußerst leistungsfähig erwiesen hat. FFmpeg 8.0 kann mit der --enable-whisper
Bibliothek gebaut werden, wenn die Whisper.cpp
Bibliothek auf dem System vorhanden ist, um das OpenAI Whisper-Modell zu unterstützen. Es gibt eine optionale GPU-Beschleunigung und verschiedene Tunables, die verwendet werden können, um die automatische Transkription mit FFmpeg auszuführen, um den Text in eine SRT-Datei zu übertragen, die Ausgabe im JSON-Format an einen HTTP-Webdienst zu senden und andere Fähigkeiten.
Wer sich für die Unterstützung des OpenAI Whisper Audiofilters interessiert, der über das Wochenende in FFmpeg integriert wurde, kann diesen Git Commit bemühen.
FFmpeg 8.0 sollte in wenigen Wochen veröffentlicht werden und auch eine Reihe von Erweiterungen für die Vulkan-Beschleunigung, neue CPU-Leistung Optimierungen und eine Vielzahl von anderen Verbesserungen für diese weit verbreitete Open-Source-Multimedia-Bibliothek bieten.
Ein Service von s3n🧩net
Comments