Holen Sie sich B4BSCHWABEN.de auf Ihr Smartphone.
Klicken Sie auf das Symbol zum „Teilen” in der Toolbar von Safari.
Finden Sie die Option „Zum Home-Bildschirm”.
Mit einem Klick auf „Hinzufügen” ist die Installation abgeschlossen!
Schon ist die Website als App auf Ihrem iOS-Gerät installiert.
B4B-Leser fragt:
Wir versuchen, die Kunden in unserer Datenbank nach Interessen und Potentialen zu selektieren. Manchmal haben wir den Eindruck, wir reizen das zu weit aus und kommen irgendwann zur „Zielgruppe 1“. Wie eng darf man den Rahmen eigentlich setzen, damit die Ergebnisse noch repräsentativ bleiben?
Unser Experte für Data Science, Andreas Berghammer von PROCON IT, antwortet:
Ich interpretiere die Frage so, dass Sie versuchen, mit manuellen Selektionen Kunden in verschiedene Cluster aufzuteilen. Doch mit Machine Learning kommen Sie schneller und effizienter zum Ziel.
Clustering im Bereich Machine Learning
Das Bilden von Kundengruppen kann im Bereich Machine Learning mit automatisiertem Clustering erreicht werden. Clustering ist hierbei eine Methode aus dem Data Mining und fällt unter die Kategorie des Unsupervised Learning, also unbeaufsichtigtes Lernen. Das bedeutet, dass die Daten nicht manuell mit Kategorien bzw. Gruppen versehen werden müssen, sondern ein Algorithmus automatisiert Kategorien erkennt und die Daten in diese einteilt. Daten in einer Kategorie haben mehr Ähnlichkeit mit weiteren Daten innerhalb derselben Kategorie als in den anderen Kategorien. Somit können Zusammenhänge und Gruppierungen innerhalb der Daten aufgedeckt werden. Gemeinsam mit Experten aus den Fachbereichen müssen hierfür die relevante Datenquellen und Eingangsvariablen definiert werden, um eine solide Grundlage für das Data Mining zu schaffen.
Darauf müssen Sie achten
Das Schaffen einer soliden Datenbasis ist essenziell für die weiterführenden Schritte. So sollten die Daten zunächst Schritte des Data Preparation durchlaufen, damit sie optimal für den gewählten Algorithmus vorbereitet sind. Ausreißer, fehlende bzw. falsche Werte oder eine starke Korrelation zwischen Spalten (sogenannten Features) können die Ergebnisse mancher Algorithmen negativ beeinflussen. Weiterhin sollten die Daten bei einigen Algorithmen normalisiert und die Skalierung angepasst werden: Damit wird sichergestellt, dass der Algorithmus die Ähnlichkeit zwischen Daten korrekt errechnen kann, ohne dass zum Beispiel eine unerwünschte Gewichtung durch eine unterschiedliche Varianz in den Features entsteht.
Unbeaufsichtigtes Lernen: Hier muss ein Fachmann die Ergebnisse überprüfen
Beim unbeaufsichtigten Lernen müssen die Ergebnisse hinterfragt und von Fachexperten betrachtet werden. Die Sinnhaftigkeit und der Informationsgehalt der Ergebnisse müssen vom Fachbereich interpretiert werden. Hierfür werden die Ergebniscluster analysiert, bewertet und zur Finalisierung beschrieben. Die Beschreibung ist essenziell, um später nachvollziehen zu können, welche fachliche Bedeutung die Einteilung eines Kunden in Gruppe 1, 2 oder 3 hat.
Sie haben Rückfragen an unseren Experten für Data Science, Andreas Berghammer, oder wünschen eine tiefergehende Beratung? Dann nehmen Sie jetzt direkt Kontakt auf.