Hier haben wir für euch Datensätze gesammelt, die ihr für eure Text Processing Algorithmen benutzen könnt.

  • QWONE – 20 newsgroups to words – Link
  • Reuters (RCV*) Corpuses: text/topic prediction – Link
  • Penn Treebank : Next word prediction – Link
  • Broadcast News for corpus creation and next word prediction – Link
]]>