Methoden

Je nach Anwendungsgebiet unterscheiden sich die verwendeten Data Science Methoden. Eine grobe Differenzierung teilt ein:


Beobachtungsanalyse

Erkennen von Mustern und Zusammenhängen in vorliegenden Daten


Korrelation &
Clustering
Ermittlung von Ähnlichkeiten zwischen Objekten (z. B. Kunden, Schäden etc.) und anschließende Gruppierung, Aufdecken von Zusammenhängen

Ausreißererkennung
Identifizierung von ungewöhnlichen Datensätzen: Ausreißern, Fehlern, Änderungen, untypischem Verhalten (z. B. in Schäden etc.)

Assoziationsanalyse/
Hypothesentests

Identifizierung von Zusammenhängen und Abhängigkeiten in den Daten in Form von Regeln wie „Aus A und B folgt normalerweise C“.

(Visuelle) Exploration
Zusammenfassende Darstellung des Datensatzes mit möglichst interaktiven Elementen, die visuelles Erfassen von Mustern und Abhängigkeiten erlaubt.

Dimensionsreduktion
Komponentenanalyse (PCA etc.), auch für Zeitreihen (ICA, saisonale Schwankungen)


Spezielle Daten

Spezielle Daten(quellen)


Text-Mining
Extraktion von Informationen aus Texten (Topic Extraction etc.), Gruppierung von Texten, Finden relevanter Themen (z. B. in Kundenschreiben, Beschwerden etc.)


Prognose &
Predictive Analytics

Vorhersage der Eigenschaften neuer Daten aufgrund automatisch erkannter Ähnlichkeiten zu bestehenden Daten


Klassifikation
Bisher nicht in Klassen eingeteilte Elemente werden den bestehenden Klassen zugeordnet (z. B. Vorhersage von RS-affinen Kunden anhand der Trainingsmenge bisheriger RS-Kunden)

(Lineare) Regression
Identifizierung von Beziehungen zwischen (mehreren) abhängigen und unabhängigen Variablen (typisch: Regressionsgeraden etc.)

Simulation
Parametrisierung eines (kunden)spezifischen Modells und Verwendung zur Abschätzung zukünftiger Eigenschaften und Modellausprägungen

Ereigniszeitanalyse
Vergleich des Zeitraums bis zum Eintreten eines Ereignisses, Schätzung prognostischer Faktoren (Survival Analysis etc.)

Statistische Modellierung
Daten/Rauschen mit statistischen Verteilungen modellieren, z. B. Verteilungen an Histogramme/Punktwolken fitten, zeitliche Verläufe fitten

 

Technologien

Wir lösen Ihre Herausforderung mit der für Sie passendsten technischen Lösung.

Unser Innovationsradar stellt sicher, dass wir Ihnen immer modernste Technologien, Tools und Algorithmen im Bereich Data Science anbieten:

DSC_Technologien