Andreas Berghammer, PROCON IT

Daten aus dem Corona-Jahr: Wertvoll oder hinderlich?

Extremwertdaten aus dem Corona-Jahr können für die Datenverarbeitung wertvoll oder hinderlich sein. Doch wann trifft was zu?

B4B-Leser fragt: 

Wie geht man denn vernünftigerweise mit der Analyse von Daten um, wenn darin total untypische Werte wie aus dem Corona-Jahr enthalten sind? Es gibt je keine Vergleichsdaten oder Korrekturwerte, auf die man sich verlassen kann, wenn eine solche außergewöhnliche Krise aufgetreten ist. Oder?

Unser Experte für Data Science, Andreas Berghammer von PROCON IT, antwortet:

Bei Daten aus dem Corona-Jahr handelt es sich in der Regel um Extremwertdaten. Das sind Daten, die eine Situation beschreiben, die selten auftritt und extreme Ausprägungen mit sich bringt. Ob diese für die Datenverarbeitung hinderlich oder förderlich sind, hängt direkt von der Fragestellung ab.

Einflüsse aus dem Corona-Jahr herauslesen

Werden beispielsweise solche Extremwertdaten des Corona-Jahres mit Daten aus den Jahren davor in Bezug auf einen gewissen Sachverhalt verglichen, so kann daraus wichtige Einsichten gewonnen werden, welchen Einfluss solche „Ausnahmezustände“ auf das eigene Business haben.

Hinderlich bei der Trendanalyse

Wird hingegen eine langfristigen Trendanalyse unter Nutzung historischer Daten aus den letzten 20 Jahren angefertigt, so kann es sein, dass solche Extremdaten die Aussage verwässern und beispielsweise einen Trend verringern/verstärken.

Noch ist ja nicht klar, ob solche extremen Zustände künftig häufiger auftreten werden oder nicht. Daher liegt es im subjektiven Interesse des Analysten, ob solche Zustände wie eine globale Pandemie in die Modellierung grundsätzlich aufgenommen oder ignoriert werden sollen. 

Extremwertdaten sind potenziell wertvoll

Letztlich sind solche Extremwertdaten potenziell sehr wertvoll: Sie beschreiben Sachverhalte aus einem sehr „seltenen“ Blickwinkel und bieten wohl einzigartige Möglichkeiten, von diesen Extremwertdaten zu lernen.

Ob es gelingt, einen Mehrwert aus diesen Informationen zu gewinnen, hängt jedoch wie erwähnt stark vom Anwendungsfall ab. Für Finanzinstitute sind diese Extremwerte sicherlich sehr wertvoll und geben Aufschluss darüber, wie sich Märkte und Unternehmen in Krisenzeiten verhalten. Dies kann unter anderem dabei helfen, finanzielle Risiken künftig besser zu beurteilen und entsprechend abzusichern.

Es ist nicht ausgeschlossen, dass in den nächsten Jahrzehnten eine Pandemie mit ähnlichen Auswirkungen auftritt. Vielleicht entpuppen sich dann gerade diese Extremwertdaten als Bereicherung.

Daten mit einzubeziehen, bereinigen oder filtern?

Es handelt sich also immer um eine subjektive Entscheidung, die Daten mit einzubeziehen, zu bereinigen oder zu filtern. Jedoch sollte man sich dabei stets bewusst sein, welche Schritte welche Auswirkungen auf die Interpretation der gewonnenen Aussagen hat. Alles in allem ist eine Aussage, wie mit den Extremdaten umgegangen werden soll, nur in Kombination mit dem entsprechenden Anwendungsfall zu treffen.

Sie haben Rückfragen an unseren Experten für Data Science, Andreas Berghammer, oder wünschen eine tiefergehende Beratung? Dann nehmen Sie jetzt direkt Kontakt auf.

Weitere Artikel zum Gleichen Thema
Andreas Berghammer, PROCON IT

Daten aus dem Corona-Jahr: Wertvoll oder hinderlich?

Extremwertdaten aus dem Corona-Jahr können für die Datenverarbeitung wertvoll oder hinderlich sein. Doch wann trifft was zu?

B4B-Leser fragt: 

Wie geht man denn vernünftigerweise mit der Analyse von Daten um, wenn darin total untypische Werte wie aus dem Corona-Jahr enthalten sind? Es gibt je keine Vergleichsdaten oder Korrekturwerte, auf die man sich verlassen kann, wenn eine solche außergewöhnliche Krise aufgetreten ist. Oder?

Unser Experte für Data Science, Andreas Berghammer von PROCON IT, antwortet:

Bei Daten aus dem Corona-Jahr handelt es sich in der Regel um Extremwertdaten. Das sind Daten, die eine Situation beschreiben, die selten auftritt und extreme Ausprägungen mit sich bringt. Ob diese für die Datenverarbeitung hinderlich oder förderlich sind, hängt direkt von der Fragestellung ab.

Einflüsse aus dem Corona-Jahr herauslesen

Werden beispielsweise solche Extremwertdaten des Corona-Jahres mit Daten aus den Jahren davor in Bezug auf einen gewissen Sachverhalt verglichen, so kann daraus wichtige Einsichten gewonnen werden, welchen Einfluss solche „Ausnahmezustände“ auf das eigene Business haben.

Hinderlich bei der Trendanalyse

Wird hingegen eine langfristigen Trendanalyse unter Nutzung historischer Daten aus den letzten 20 Jahren angefertigt, so kann es sein, dass solche Extremdaten die Aussage verwässern und beispielsweise einen Trend verringern/verstärken.

Noch ist ja nicht klar, ob solche extremen Zustände künftig häufiger auftreten werden oder nicht. Daher liegt es im subjektiven Interesse des Analysten, ob solche Zustände wie eine globale Pandemie in die Modellierung grundsätzlich aufgenommen oder ignoriert werden sollen. 

Extremwertdaten sind potenziell wertvoll

Letztlich sind solche Extremwertdaten potenziell sehr wertvoll: Sie beschreiben Sachverhalte aus einem sehr „seltenen“ Blickwinkel und bieten wohl einzigartige Möglichkeiten, von diesen Extremwertdaten zu lernen.

Ob es gelingt, einen Mehrwert aus diesen Informationen zu gewinnen, hängt jedoch wie erwähnt stark vom Anwendungsfall ab. Für Finanzinstitute sind diese Extremwerte sicherlich sehr wertvoll und geben Aufschluss darüber, wie sich Märkte und Unternehmen in Krisenzeiten verhalten. Dies kann unter anderem dabei helfen, finanzielle Risiken künftig besser zu beurteilen und entsprechend abzusichern.

Es ist nicht ausgeschlossen, dass in den nächsten Jahrzehnten eine Pandemie mit ähnlichen Auswirkungen auftritt. Vielleicht entpuppen sich dann gerade diese Extremwertdaten als Bereicherung.

Daten mit einzubeziehen, bereinigen oder filtern?

Es handelt sich also immer um eine subjektive Entscheidung, die Daten mit einzubeziehen, zu bereinigen oder zu filtern. Jedoch sollte man sich dabei stets bewusst sein, welche Schritte welche Auswirkungen auf die Interpretation der gewonnenen Aussagen hat. Alles in allem ist eine Aussage, wie mit den Extremdaten umgegangen werden soll, nur in Kombination mit dem entsprechenden Anwendungsfall zu treffen.

Sie haben Rückfragen an unseren Experten für Data Science, Andreas Berghammer, oder wünschen eine tiefergehende Beratung? Dann nehmen Sie jetzt direkt Kontakt auf.

Weitere Artikel zum Gleichen Thema
nach oben