Ihr sucht nach Datensätzen für eure Speech Processing Algorithmen? Wir haben für euch eine Auswahl von Data Sets vorbereitet. Viel Spaß!

  • TIMIT Speech Corpus: Klassifikation von Phonemen – Link
  • 2000HUB5: Baidu Datenset in englischer Sprache – Link
  • LibriSpeech: 500 Stunden Aufnahmen von Hörbüchern in englisch – Link
  • VoxForge: Sauber gesprochenes Englisch – Link
  • CHIME: 4 Sprecher in geräuschstarken Umgebungen – Link
  • TED-LIUM: Aufnahmen und Transkripte von TED-Talks – Link
]]>