Hier haben wir für euch Datensätze gesammelt, die ihr für eure Text Processing Algorithmen benutzen könnt.
- QWONE – 20 newsgroups to words – Link
- Reuters (RCV*) Corpuses: text/topic prediction – Link
- Penn Treebank : Next word prediction – Link
- Broadcast News for corpus creation and next word prediction – Link