Ihr sucht nach Datensätzen für eure Speech Processing Algorithmen? Wir haben für euch eine Auswahl von Data Sets vorbereitet. Viel Spaß!
- TIMIT Speech Corpus: Klassifikation von Phonemen – Link
- 2000HUB5: Baidu Datenset in englischer Sprache – Link
- LibriSpeech: 500 Stunden Aufnahmen von Hörbüchern in englisch – Link
- VoxForge: Sauber gesprochenes Englisch – Link
- CHIME: 4 Sprecher in geräuschstarken Umgebungen – Link
- TED-LIUM: Aufnahmen und Transkripte von TED-Talks – Link