Menü
Data Mesh in der Praxis

Webinar | 16. Juni, 11 Uhr

Wie Zalando, Europas führende Online Plattform für Fashion, seine Daten jenseits des Data Lake Paradigmas organisiert.


Bei der Herausforderung, Daten und deren Nutzung im Unternehmen zu demokratisieren, wird das Data Lake Paradigma häufig als der besser skalierbare Nachfolger des stärker kurierten Data Warehouse Ansatzes betrachtet. Sind jedoch die Verantwortlichkeiten nicht klar, kann ein zentralisierter Data Lake leider schnell zu einem wenig wertschöpfenden Datensumpf verkommen.

Bei Zalando haben wir früh erkannt, dass Daten-Zugänglichkeit und -Verfügbarkeit im großen Rahmen nur garantiert werden kann, wenn die Hauptverantwortung bei denjenigen liegt, die die Daten generieren und über das entsprechende Domänenwissen verfügen, während sich zentralisierte Verantwortung auf Governance und Metadatenbereitstellung beschränkt.


Ein solch dezentralisierter Ansatz mit Domänengrenzen im Fokus wird seit kurzem durch das Data Mesh Paradigma beschrieben. Hierbei werden sogenannte Datenprodukte in den Vordergrund gestellt bei denen Daten nicht nur zur Verfügung gestellt werden, sondern die darüber hinaus Zusagen hinsichtlich Datenqualität und Verantwortung machen. 


In diesem Webinar demonstrieren Max Schultze (Zalando) und Arif Wider (ThoughtWorks), wie sie sich von einem zentralisierten Data Lake hin zu einer verteilten Data Mesh Architektur bewegen und darauf hinarbeiten, dass die Erstellung echter Datenprodukte eine Sache von Minuten wird.

Agenda

11:00 UhrBegrüßung & Vorstellung
11:05 UhrData Mesh in der Praxis
11:45 UhrQ&A

Speakers

Arif Wider

Dr. Arif Wider ist Entwickler und Berater bei ThoughtWorks. Er entwickelt am liebsten Software, die etwas bewegt, oder baut Teams auf, die solche Software entwickeln. Als Head of AI für ThoughtWorks Deutschland treibt er diverse Daten- und Machine Learning-Aktivitäten und ist dabei immer wieder davon fasziniert, wie Data Scientists und Entwickler (wie er selbst) eng zusammenarbeiten müssen, um AI Anwendungen zum Erfolg zu führen.

Max Schultze

Max Schultze ist Lead Data Engineer und arbeitet am Aufbau eines Data Lakes bei Zalando, Europas größter Online Plattform für Mode. Sein Schwerpunkt liegt auf dem Bau von Data Pipelines mit Durchsatz von Terabytes pro Tag, sowie dem Umsetzen von Data Governance und Speichermanagement für den Cloud Storage Layer der Firma. Bei Zalando war er vorherig in das Aufsetzen und den Betrieb von Spark und Presto als analytische Plattformen involviert. Während seines Studiums an der Humboldt-Universität Berlin nahm er aktiv an den ersten Entwicklungen von Apache Flink teil.

Jetzt anmelden