Tag: Collaborative Filtering

So funktioniert Recommendation bei Spotify

Rot markiert. Recommendation bei Spotify (Credit: Chris Johnson, Spotify)

Rot markiert. Recommendation bei Spotify (Credit: Chris Johnson, Spotify)

Empfehlungssystemen begegnet man überall im Internet. Auch bei Spotify arbeitet man mit State-of-the-Art Systemen im Bereich Recommendation.

Drei verschiedene Systeme werden bei Spotify dazu benutzt, um euch die Musik vorzuschlagen, die euch sehr wahrscheinlich gefallen könnte.

Dabei bedient sich Spotify an Metadaten der Tracks, liest die Logs der gespielten Musik und durchsucht sogar Blogs und News nach verschiedenen Artikeln. Diese Informationen werden dann benutzt, um euch einen neuen Track zu empfehlen.

Diese 3 Methoden benutzt Spotify

Kollaboratives Filtern – “Wer X gehört hat, hat auch Y gehört.” Amazon nutzt beispielsweise Kollaboratives Filtern, um euch zu zeigen, welche Produkte jemand noch gekauft hat, der ähnliche Produkte wie ihr kaufte. Das funktioniert zum Beispiel über Matrixfaktorisierung.

Natural Language Processing – Die Songtexte und Beschreibungen werden mit Natural Language Processing durchsucht und nach Schlüsselwörtern sortiert. Ähnliche Textpassagen und Phrasen sprechen für eine Ähnlichkeit. Schwierig wird es, wenn der Track sehr wenige bis garkeine Lyrics enthält. Dafür gibt es noch eine dritte Form der Recommendation.

Audio Material – Auf den reinen Audiosignalen wird ein neuronales Netz (Deep Learning) angewandt. Dieses Netz erkennt Ähnlichkeiten in den Frequenenzen. Es nutzt auch weitere Features, um die Ähnlichkeit eines Songs zu bestimmen. So kann man vor allem Songs bewerten, die über keine Lyrics verfügen und bisher selten gehört wurden (also keine Chance für Kollaboratives Filtern hätten).

Ihr findet das Thema spannend? Hier gibt es den längeren Artikel dazu.

Paper Review – Sentence Generation und Sentiments mit Emojis

In unserer Rubrik Paper Review stellen wir euch aktuelle Paper aus dem Bereich Machine Learning vor. Wir fassen für euch das Wesentliche zusammen und ihr entscheidet selbst, ob ihr das Paper lesen wollt oder nicht. Viel Spaß!

In SenGen: Sentence Generating Neural Variational Topic Model zeigen die Autoren, dass ein Satz die kleinste Einheit beim Topic Modeling ist. Im Gegensatz zu vielen anderen Modellen, die Bag of Words (also Wörter) benutzen, um ein Topic-Modell aufzubauen, verwenden wie einen Satz. in den Experimenten vergleichen sie ihren Ansatz gegen die aktuellen State-of-the-Art Ansätze: LDA, NVDM, NVLDA und ProdLDA. Hier gehts zum Paper.

Die Autoren von Using millions of emoji occurrences to learn any-domain representations for detecting sentiment, emotion and sarcasm haben versucht Texte auf Emojis zu mappen. Sie nutzen dabei große Datasets und vergleichen sich mit anderen auch sehr aktuellen Forschungsergebnissen. Hier gehts zum Paper.

 

Am Rand erwähnt