Whisper REST API
Entwicklung einer Web-API für OpenAI's Whisper ASR-Modell. Die API ermöglicht die Transkription von Audiodateien über HTTP und von Streaming Audio über Websockets. Das Ausgabeformat umfasst Metadaten wie Transkriptionsdauer, Teilergebnisse und Wortzeitstempel, ähnlich den gängigen Cloud-Diensten. Damit werden Inhalte barrierefrei und für Gehörlose sowie Menschen mit Hörbeeinträchtigungen zugänglich gemacht.
Team: Florian Demel, Benedikt Scheffbuch, Torben Ziegler
Studiengang: Computer Science and Media (Master), Mobile Medien (Bachelor, 7 Semester)
Betreuer: Korbinian Kuhn