Einführung
Die Tour soll als Merkzettel dienen, welches die relevantesten Vorgehensweisen im Bereich Machine Learning zusammenfasst. Alle Sektionen bauen aufeinander auf und sollten bei einer Machine Learning Anwendung auch in dieser Reihenfolge durchgeführt werden:
- Entscheidung für den Typ der Anwendung (hier)
- Das besorgen der Daten (hier)
- Das Erstellen der Feature-Representation (hier)
- Prototyping des Feature-Vektors (hier)
- Auswahl eines Verfahrens für die Implementation (hier)
- Anschließendes Messen der Ergebnisse (hier)
Machine Learning wird in vielen Unternehmen eingesetzt, um anhand von statistischen oder logischen Algorithmen zu versuchen, Entscheidungen schneller und basierend auf vorhandenen Daten zu treffen. Dieses Dokument befasst sich ausschließlich mit statistischen Methoden. Das hat den Grund, dass in Firmen, in denen große Datenmengen anfallen, meist statistische Modelle, welche Unschärfe und Fehlertoleranz lernen können, eingesetzt werden können.
Hat man bereits bestimmte Vorstellungen, wozu man die Daten nutzen möchte und es existieren Zielwerte oder Klassen, setzt man Supervised Learning ein. Im Gegensatz dazu existieren Algorithmen, die sich unter Unsupervised Learning zusammenfassen lassen. Diese Algorithmen versuchen die Daten selbstständig zu separieren (Clustering).
Learning 1 Bei Big-Data-Anwendungen nutzt man statistische Methoden, um Daten zu separieren. Logische Regel Sets eignen sich nicht sehr gut, da sie nur mit viel Aufwand in der Lage sind, Unschärfe abzubilden.
Learning 2 Es gibt eine Pipeline, nach der man in den meisten Fällen vorgehen sollte und die dabei hilft, den Prozess des Machine Learning zu verbildlichen.
Learning 3 Supervised Learning wird benutzt, wenn man Datensätze und einen zu lernenden Zielwert definieren kann. Ist das nicht der Fall, kann man Unsupervised Learning nutzen, um Daten zu clustern und sich ein Überblick über die Struktur der Daten zu verschaffen.
Alles klar? Weiter gehts! >
Haben Sie Fragen? Wir bieten Consulting zu diesem Thema an.
Zu unseren Angeboten.]]>