Interview: Wirtschaftlichkeitsbetrachtung von Data Science Anwendungen im eCommerce und Handel

Interview mit Herrn Nicolas March von der REWE Group/REWE Digital GmbH über die Wirtschaftlichkeitsbetrachtung von Data Science Anwendungen im eCommerce und Handel. 

Herr Dr. Nicolas March ist Head of Analytics bei der REWE Digital – einem Unternehmen der REWE Group. Der promovierte Betriebswirt beschäftigt sich seit über 15 Jahren mit Business Intelligence und Advanced Analytics in unterschiedlichen Branchen, wie Handel, Telekommunikation und verarbeitender Industrie. Vor seiner Zeit bei REWE digital war er IT Consultant in der Digital Division der Accenture GmbH.

Herr March, in welchem Verhältnis stehen Big Data, Data Science, Machine Learning und Künstliche Intelligenz Ihrer Erfahrung und Ansicht nach untereinander?

Zunächst sind das keine überschneidungsfreien Begriffe oder Bereiche. So sind sehr häufig Data Science Anwendungen der analytische Kern in einem Big Data Produkt, beispielsweise ein Empfehlungsalgorithmus in einem Webshop. Die Big Data Technologien ermöglichen einerseits das Handling der extremen Datenmengen aus Web- und Kassensystemen, andererseits geben sie den technologischen Rahmen für die Integration der Auswertungsmethoden vor. Das kann eine einfache Heuristik sein oder z. B. eine Methode des maschinellen Lernens, mit deren Hilfe man Erkenntnisse aus den Daten extrahiert. Ist der Grad des selbständigen Erkenntnisgewinns und der automatisierten Verwendung durch die technische Methode sehr hoch, kann man aus meiner Sicht von einem Verfahren der „künstlichen Intelligenz“ sprechen. Da dies häufig durch Verwendung von Deep Learning Algorithmen bzw. mit neuronalen Netzen umgesetzt wird, werden diese Methoden auch häufig mit KI gleichgestellt.

Wer ist in Ihrer Branche denn der Hauptantreiber der Datennutzung? Geht dieser Drang eher von der Geschäftsführung aus oder von den Fachabteilungen?

Im LEH hat man erkannt, dass der Kunde ein möglichst auf seine Bedürfnisse abgestimmtes Einkaufserlebnis verlangt. Das geht mit einer zunehmenden Digitalisierung des Einkaufsprozesses im stationären Handel als auch mit der Bereitstellung von Online-Liefer- und Abholservices einher, bei denen der Kunde über Website und Mobile-App die Ware bestellen kann. Das dann – im Rahmen der gesetzlichen Vorgaben – die anfallenden Daten z. B. für die Personalisierung im Marketing oder eine effiziente Produktentwicklung nutzbar gemacht werden kann, versteht sich von selbst. Daneben ist den Entscheidern aber auch bewusst, dass man durch die Digitalisierung insbesondere auf Basis von Data Science Anwendungen bestehende Prozesse optimieren kann und muss, um wettbewerbsfähig zu bleiben.

Bei der Gründung von REWE digital hat man diese Ziele von Anfang an ausgelobt, so dass datengestütztes Arbeiten und Entscheiden ein grundsätzliches Leitprinzip darstellt. Dieser Fokus ist also in der DNA des Unternehmens verankert und wird sowohl von den Mitarbeitern der Fachabteilungen als auch der Geschäftsführung gelebt und eingefordert. Aber natürlich ist die Intensität dieser Leitlinie in den Fachabteilungen durchaus unterschiedlich ausgeprägt.

Wie gewährleisten Sie eine angemessene ROI-Einschätzung (Return-on-Investment)? Und wie stellen Sie sicher, dass die Produktentwicklung diesen ROI-Gedanken beibehält?

Bei REWE digital ist die Analytics Abteilung in den Produktentwicklungs- und Portfolio-Prozess eingebunden – und zwar von Beginn an. Das gilt nicht nur für viele Big Data Produkte mit einem analytischen Kern, bei denen wir ohnehin an Bord sind, sondern für beinahe alle Initiativen. In einer agilen Produktentwicklung soll möglichst jeder die Möglichkeit haben, Ideen und Initiativen einzubringen, die das Business vorantreiben. Der Vielzahl an aufkommenden Ideen stehen jedoch häufig begrenzte Ressourcen gegenüber. Um diese bewerten und ressourcenschonend umzusetzen, liefern unsere Analytiker zu jeder Initiative bzw. Idee das unterstützende Zahlenwerk. Beispielsweise erstellen wir Vorabanalysen zur Bestimmung, ob die Grundannahmen einer Initiative richtig sind und sich ggf. bereits in den vorhandenen Daten auch wiederfinden. Zudem helfen wir den Product Ownern auch während der Initiative, in dem wir einfache Anpassungen oder den MVP durch A/B- und Hypothesentests frühzeitig auf Werthaltigkeit überprüfen. Auch nach dem Go-Live wird mit unserer Hilfe geprüft, ob die gesetzten Ziele erreicht wurden. Mit diesen Analysen und A/B-Tests vor, während und nach der Entwicklung helfen wir dem CPO (Chief Product Owner), ein fundiertes Portfolio zusammenzustellen, Erkenntnisse für zukünftige Initiativen zu gewinnen und den ROI seiner Maßnahmen zu sichern. Dafür ist die Produktentwicklung dankbar und nimmt unseren Support gerne in Anspruch.

Welche Anwendungsfälle sehen Sie zurzeit als die wichtigsten im Kontext der Datennutzung? Und welche Themen hätten durchaus noch ein paar Jahre Zeit?

Natürlich sind weiterhin viele Analytics Themen auf die Kundenanalyse ausgerichtet und dienen insbesondere dem Marketing und der Produktentwicklung z. B. im Rahmen der Personalisierung. Den traditionellen Unternehmen ist aber bewusst geworden, dass Analytics eine Querschnittsfunktion ist, die in vielen Bereichen große Potentiale freisetzen kann. Das Thema „Supply Chain Analytics“ verspricht ein riesiges Potential, da mit Big Data und Data Science noch viele kostenintensive Prozesse optimiert werden können. Im Handel sind das beispielsweise Anwendungsfälle, wie die optimale Kapazitäts- und Warenbestellprognose mit Big Data Technologien zur Vermeidung von Abschriften und Stock-out. Aber auch kleinere Prozesse, wie die Standzeitenschätzung von Lieferfahrern helfen, den Personaleinsatz zu optimieren.

Ein weiteres Gebiet, das aus meiner Sicht in allen mir bekannten Unternehmen ein noch großes Entwicklungspotential verspricht, ist „People Analytics“ –  gerade weil die Investition in den Faktor „menschliche Arbeitskraft“ häufig einer der größten Kostenpositionen darstellt. Daher rückt auch in den HR Abteilungen das datengetriebene, analytische Arbeiten mehr und mehr in den Fokus. Anwendungsfälle, wie die Erfolgsanalyse von Recruiting-Kampagnen oder die Prognose von Mitarbeiter-Churn kann für Arbeitgeber ein Wettbewerbsvorteil im hart umkämpften Arbeitsmarkt sein. Zu bedenken ist dabei immer, dass dieses Thema in den HR-Abteilungen aufgrund der personenbezogenen Daten zu Recht mit großer Sensibilität und Vorsicht angefasst wird. People Analytics bedeutet für mich aber nicht die Überwachung des einzelnen Arbeitnehmers, sondern vielmehr die Möglichkeit, seine Arbeitsumgebung durch Analyse anonymisierter Daten optimal auf ihn anzupassen und dadurch seine Zufriedenheit in beiderseitigem Interesse zu erhöhen.

Wenn ich darüber nachdenke, welche Themen im Online-Lebensmittelhandel noch Zeit haben, dann sind das wahrscheinlich Künstliche Intelligenz in der Robotics oder der Warendistribution. Es ist sicherlich hoch spannend, wenn in der Zukunft Pick&Place Roboter auch die Tüten packen und Lieferfahrzeuge beladen könnten.  In unserer Branche denken bestimmt auch viele über die autonome Auslieferung nach. Allerdings ist die Komplexität dieser Anwendungsfälle sehr hoch und es wird bis zu deren wirtschaftlichem Einsatz ohne die Einbindung menschlicher Arbeitskraft sicher noch dauern.

Wie setzt sich Ihr Team zusammen? Unterscheiden Sie strikt zwischen Data Engineer und Data Scientist?

Unsere Data Scientists arbeiten eng mit Data Engineers zusammen. Ich habe noch selbst viele Datenquellen erschlossen und deren Transformation vorgenommen, bevor mit der Erstellung komplexer Modelle begonnen wurde. Da die Infrastrukturlandschaft aber vielseitiger und komplexer geworden ist und sich nicht mehr nur auf eine Hand voll relationaler Datenbanksysteme oder weniger Message Services beschränkt, sind erfahrene Data Engineers für deren Nutzbarmachung unerlässlich. Data Engineers müssen wissen, wie sie unterschiedliche Quellsysteme in die Analyseumgebungen integrieren und auch häufig die Fachlichkeit in den Daten verstehen. Es kann vorkommen, dass dabei auch mit Rechenmethoden und Frameworks bereits Daten voraggregiert werden oder in KPIs überführt werden. Die Modellierung zur Entwicklung eines Produkts oder eines analytischen Prozesses ist bei uns aber weiterhin eher der Job des Data Scientists.

Wie schaffen Sie die Integration von Analysten und Data Scientists sowie Software Entwicklern für die Produktentwicklung?

Unser Team an Data Scientists wird grob in zwei Bereichen eingesetzt. Zum einen entwickeln sie prototypische Modelle zur Verbesserung von Prozessen in den Fachabteilungen. Geht es zum anderen von Beginn an um die Erstellung eines Softwareprodukts mit einem analytischen Kern – wie eine Empfehlungsmodul im Webshop -, ist der Data Scientist ein Teil des agilen Entwicklungsteams und bringt die analytische Kompetenz mit ein. Unsere Data Scientists arbeiten dann im Tagesgeschäft als vollwertiges Mitglied im SCRUM-Modus in einem der Big Data oder Plattform-Teams mit. Diese Integration hat für beide Seiten große Vorteile. Die Developer haben stets einen Analytiker im Team der die Datenlage, Anforderungen und Prozesse des Business sehr genau kennt und dieses Wissen mit in das Team einbringt. Andererseits versteht der Data Scientist den Softwareentwicklungsprozess und bekommt mit, wie beispielsweise technische Limits ein konzeptionelles Modell ggf. nicht unterstützen. Durch Rotation und Wechsel zwischen diesen Einsatzszenarien wollen wir sicherstellen, dass die Data Scientists sehr vielseitig einsetzbar sind und gleichzeitig ihre Methodenkompetenz stets ausbauen können.