Wie wird aus Daten eine 360°-Kundensicht?
Welche Technologien unterstützen Data-Science-Initiativen?
Wie gelingen detaillierte Prognosen?
Wie wird aus Daten eine 360°-Kundensicht?
Welche Technologien unterstützen Data-Science-Initiativen?
Wie gelingen detaillierte Prognosen?
Data-Science-Verfahren liefern nur dann verwertbare Informationen, wenn die Grundlage stimmt. Ungenaue Daten bedeuten immer auch ungenaue Erkenntnisse. Oder, anders ausgedrückt: wenn im Erdgeschoss die Wände schief stehen, sind die Baupläne für den Dachausbau unbrauchbar. Wer trotzdem weiterbaut, macht es umso schlimmer, weil er am Ende mit dem Kaschieren nicht mehr hinterherkommt.
Bei der Energieversorgung Mittelrhein (evm) entwickelte sich der Wunsch, die Customer Journey der Kunden und Kundinnen gezielter nachvollziehen zu können. Darauf aufbauend stand eine automatisierte und kundenspezifische Ansprache auf Basis von Vertrags- und Verhaltensdaten auf dem Programm. Am Ende dieser Verwertungskette aus datengetriebenen Insights sollten schließlich Prognosen und Trends analysierbar gemacht und als wirtschaftliche Entscheidungshilfen genutzt werden. Zurück zum Hausbau: um die neuste State-of-the-Art Solartechnik auf dem Dach zu installieren, musste erst einmal der richtige Beton für den Keller neu angemischt werden.
Gemeinsam mit taod ist der Energieversorgung Mittelrhein die komplexe und aufwändige Bereinigung ihrer Datenbasis gelungen. Mit Hilfe des Rekord-Linkage-Verfahrens wurden die bereinigten Daten anschließend einem Abgleich unterzogen, um eine korrigierte Historie aufzubauen. Der Aufbau eines neuen cloudbasierten Modern Data Warehouse in Azure bildet zudem eine zuverlässige und performante Grundlage für alle zukünftigen Data-Science-Initiativen.
In einem Data Thinking Workshop sowie einem darauffolgenden Data Discovery Workshop erfassen die evm und taod die Ist-Situation. Die Identifikation erster Use Cases sorgt für eine detaillierte Anforderungsanalyse, die schließlich zu einem MVP-Ansatz führt. Auf Basis der vorhandenen Datenstrategie erfolgt die Sprint-Planung, die permanente agile Erweiterungen zulässt.
Da die Daten im Abrechnungssystem eine mangelnde Qualität aufweisen, nicht über mehrere Attribute hinweg geprüft werden können und auch Ähnlichkeitsvergleiche nicht möglich sind, kommt das Record-Linkage-Verfahren zum Einsatz. Auf Basis der Ähnlichkeitseinschätzungen der ausgewählten Attribute lernt das Record-Linkage-Modell automatisiert, wie wahrscheinlich es ist, dass zwei Datensätze zusammengehören. Da diese Berechnungen komplexe statistische Verfahren (wie zum Beispiel Expectation Maximization) erfordern, ist der Aufbau einer adäquaten Cloud-Infrastruktur unumgänglich.
Azure Synapse bietet für den Aufbau der Cloud-Umgebung für die Energieversorgung Mittelrhein nicht nur die nötige Datenanbindung und Datenaufbereitung durch ETL-Pipelines, sondern auch eine nahtlose Integration in Cluster-Compute-Instanzen in Apache Spark. Mit diesem Tech Stack ist es gelungen, bestehende Ansätze zur eindeutigen Kundenidentifizierung zu automatisieren, die Ergebnisse flexibel in das neue Modern Data Warehouse zu integrieren und mit einem adäquaten Monitoring in die Geschäftsprozesse einzubinden.
Gemeinsam mit taod ist der evm die komplexe und aufwendige Bereinigung ihrer Datenbasis unter Einsatz des Rekord-Linkage-Verfahrens gelungen. Der Aufbau eines neuen cloudbasierten Modern Data Warehouse in Azure bildet zudem eine zuverlässige und performante Grundlage für alle zukünftigen Data-Science-Initiativen.
Sarah Burdenksi
Teamleitung Kundenbindung & Analytisches Marketing / evm
Triff Vorhersagen, automatisiere deine Prozesse und decke Trends und Muster auf mit unserer AI Beratung.
Mit Microsoft Azure Services und unserem Azure Consulting erweiterst du die Grenzen deiner aktuellen Plattform.
Wie man Potenziale von Data-Initiativen erkennt, fördert und für Data Science Lösungen beschleunigt.