/ 
Themen  / 
Daten aus dem Corona-Jahr: Wertvoll oder hinderlich?
Anzeige

Wir benötigen Ihre Zustimmung zum Laden dieser Anzeige!

Wir verwenden einen Drittanbieterdienst, um Anzeigen darzustellen, die möglicherweise Daten über Ihre Aktivität sammeln. Bitte überprüfen Sie die Details und akzeptieren Sie den Dienst, um diese Anzeige zu sehen.

Dieser Inhalt darf aufgrund von Trackern, die dem Besucher nicht bekannt gegeben werden, nicht geladen werden. Der Website-Eigentümer muss die Website mit seinem CMP einrichten, um diesen Inhalt in die Liste der verwendeten Technologien aufzunehmen.

powered by Usercentrics Consent Management Platform
Andreas Berghammer, PROCON IT

Daten aus dem Corona-Jahr: Wertvoll oder hinderlich?

 MicrosoftTeams-image
Andreas Berghammer, Head of Data Solutions & AI bei PROCON IT. Foto: PROCON IT
Von Andreas Berghammer

Extremwertdaten aus dem Corona-Jahr können für die Datenverarbeitung wertvoll oder hinderlich sein. Doch wann trifft was zu?

B4B-Leser fragt: 

Wie geht man denn vernünftigerweise mit der Analyse von Daten um, wenn darin total untypische Werte wie aus dem Corona-Jahr enthalten sind? Es gibt je keine Vergleichsdaten oder Korrekturwerte, auf die man sich verlassen kann, wenn eine solche außergewöhnliche Krise aufgetreten ist. Oder?

Unser Experte für Data Science, Andreas Berghammer von PROCON IT, antwortet:

Bei Daten aus dem Corona-Jahr handelt es sich in der Regel um Extremwertdaten. Das sind Daten, die eine Situation beschreiben, die selten auftritt und extreme Ausprägungen mit sich bringt. Ob diese für die Datenverarbeitung hinderlich oder förderlich sind, hängt direkt von der Fragestellung ab.

Einflüsse aus dem Corona-Jahr herauslesen

Werden beispielsweise solche Extremwertdaten des Corona-Jahres mit Daten aus den Jahren davor in Bezug auf einen gewissen Sachverhalt verglichen, so kann daraus wichtige Einsichten gewonnen werden, welchen Einfluss solche „Ausnahmezustände“ auf das eigene Business haben.

Hinderlich bei der Trendanalyse

Wird hingegen eine langfristigen Trendanalyse unter Nutzung historischer Daten aus den letzten 20 Jahren angefertigt, so kann es sein, dass solche Extremdaten die Aussage verwässern und beispielsweise einen Trend verringern/verstärken.

Noch ist ja nicht klar, ob solche extremen Zustände künftig häufiger auftreten werden oder nicht. Daher liegt es im subjektiven Interesse des Analysten, ob solche Zustände wie eine globale Pandemie in die Modellierung grundsätzlich aufgenommen oder ignoriert werden sollen. 

Extremwertdaten sind potenziell wertvoll

Letztlich sind solche Extremwertdaten potenziell sehr wertvoll: Sie beschreiben Sachverhalte aus einem sehr „seltenen“ Blickwinkel und bieten wohl einzigartige Möglichkeiten, von diesen Extremwertdaten zu lernen.

Ob es gelingt, einen Mehrwert aus diesen Informationen zu gewinnen, hängt jedoch wie erwähnt stark vom Anwendungsfall ab. Für Finanzinstitute sind diese Extremwerte sicherlich sehr wertvoll und geben Aufschluss darüber, wie sich Märkte und Unternehmen in Krisenzeiten verhalten. Dies kann unter anderem dabei helfen, finanzielle Risiken künftig besser zu beurteilen und entsprechend abzusichern.

Es ist nicht ausgeschlossen, dass in den nächsten Jahrzehnten eine Pandemie mit ähnlichen Auswirkungen auftritt. Vielleicht entpuppen sich dann gerade diese Extremwertdaten als Bereicherung.

Daten mit einzubeziehen, bereinigen oder filtern?

Es handelt sich also immer um eine subjektive Entscheidung, die Daten mit einzubeziehen, zu bereinigen oder zu filtern. Jedoch sollte man sich dabei stets bewusst sein, welche Schritte welche Auswirkungen auf die Interpretation der gewonnenen Aussagen hat. Alles in allem ist eine Aussage, wie mit den Extremdaten umgegangen werden soll, nur in Kombination mit dem entsprechenden Anwendungsfall zu treffen.

Sie haben Rückfragen an unseren Experten für Data Science, Andreas Berghammer, oder wünschen eine tiefergehende Beratung? Dann nehmen Sie jetzt direkt Kontakt auf.

Artikel zum gleichen Thema