Od Lakehouse do AI-ready data: czy naprawdę rozumiemy nasze dane?
Nowoczesne architektury danych obiecują prostotę: jeden model, jeden system, dane gotowe do wszystkiego — od raportów po AI. Rozwiązania takie jak Data Lakehouse upraszczają dostęp do danych, ale jednocześnie ukrywają rosnącą złożoność związaną z ich jakością, semantyką i przygotowaniem pod modele.
W tej prezentacji przyjrzymy się kompromisom, które stoją za współczesnymi architekturami danych. Co tak naprawdę oznacza „AI-ready data”? Dlaczego dane, które działają w BI, często zawodzą w kontekście modeli ML i RAG? I gdzie w tym wszystkim tracimy kontrolę nad tym, co naprawdę dzieje się z danymi?
Porozmawiamy o tym:
– gdzie kończy się wygoda, a zaczyna ukryty koszt,
– czym jest delegacja odpowiedzialności za dane w nowoczesnych stackach,
– oraz co się dzieje, gdy AI zaczyna korzystać z danych, których do końca nie rozumiemy.
Jarosław Kruk
Data Platform Engineer i Solution Architect specjalizujący się w projektowaniu nowoczesnych platform danych - od klasycznych rozwiązań on-premise po systemy oparte o Data Lakehouse w chmurze. Ma doświadczenie w pracy z dużymi wolumenami danych oraz w budowie systemów, które muszą być jednocześnie skalowalne, niezawodne i możliwe do utrzymania. Pracował zarówno z tradycyjnymi architekturami danych, jak i nowoczesnymi platformami takimi jak Databricks, obserwując jak zmienia się sposób, w jaki organizacje zarządzają danymi. W swojej pracy skupia się na upraszczaniu złożonych systemów oraz na zrozumieniu, gdzie nowoczesne abstrakcje pomagają, a gdzie zaczynają ukrywać kluczowe problemy - szczególnie w kontekście przygotowania danych pod AI.