EchoQuest
Herausforderung
Das Extrahieren wichtiger Erkenntnisse aus stundenlangen aufgezeichneten Interviews ist eine manuelle und zeitaufwändige Aufgabe.
Lösung
Ich habe 'EchoQuest' entworfen, eine End-to-End-Pipeline, die Roh-Audiodaten in eine durchsuchbare Wissensdatenbank umwandelt. Sie verbessert die Audioqualität, trennt Sprecher (Diarisierung), transkribiert mit Whisper von OpenAI und indiziert den Inhalt.
Ergebnis
Ein leistungsstarkes Analysewerkzeug, bei dem ein Benutzer natürliche Sprachfragen zum Interview stellen kann ('Was hat Sarah über das Budget gesagt?') und sofortige, genaue Antworten erhält.
Wichtige Highlights
Audioverbesserung
Verbessert die Audioqualität für eine bessere Transkription.
Sprechererkennung
Identifiziert, wer während der Aufnahme spricht.
KI-gestützte Analyse
Stellen Sie natürliche Fragen zum Inhalt des Interviews.

Technologie-Stack
Audio
PyTorch Audio
Whisper
Pyannote
Analysis
LangChain
Transformers
Infra
FastAPI
Redis
PostgreSQL