Was ist ein Feature Vector beim Machine Learning? Ein Feature Vector codiert alle Merkmale, die man benötigt, um ein Modell trainieren zu können. Dabei werden verschiedene Merkmale zu Zahlen codiert, bspw. auch Zeichenketten. Möglichkeiten der Codierung
- Binäre Angaben
- Werden meist direkt binär codiert
- Zahlen (bspw. Alter)
- Abbildung als Zahlen (Alter als Zahl)
- Abbildung in Bins (19-21, 22-24, etc. werden als einzelne Dimensionen abgebildet)
- Andere Ansätze
- Zeichenketten
- Dictionary (pro Wort oder N-Gram wird eine Dimension im Vektor benutzt)
- Gruppierung von semantisch / syntaktisch ähnlichen Zeichenketten
- Andere Ansätze