Gdzie w analityce jest miejsce na Self-service?
Do jednej z sal konferencji Data Science Summit w Warszawie szło się długim korytarzem. Miał się w niej odbyć wykład na temat self-service w Business Intelligence. Korytarz był oflankowany pracownikami firm konsultingowych i firm z branży IT. Wszyscy oni, obłożeni gadżetami i plakatami, szukali kandydatów na stanowiska: „Specjalista od przetwarzania danych”, „Data steward”, „Inżynier danych”. Prowadzący prelekcję, wykładowca Politechniki Rzeszowskiej, przyszedł do sali tą samą drogą. Po wejściu zadał pytanie: Proszę Państwa, skoro poszukiwanych jest tylu specjalistów od przetwarzania danych, to czy sformułowanie „Self-Serivce BI” ma sens? To pytanie uświadomiło mi, że hasła samoobsługowości w analityce danych są często nadużywane. Rzeczywistość jest trochę bardziej skomplikowana niż da się to przedstawić w krótkim haśle marketingowym.
Zgadzam się z hasłem self-service bezwarunkowo, jeżeli rozumiemy pod nim niski próg wejścia, czyli łatwość samodzielnego uruchomienia i rozpoczęcia przygody z analizami w narzędziu lepiej do tego stworzonym niż Excel. Nie potrzeba specjalistycznej wiedzy, by zacząć przygodę we współczesnych narzędziach BI. Jeżeli natomiast pod self-service chcemy rozumieć samoobsługowość w zaspokajaniu pełni potrzeb analitycznych organizacji, to musimy być ostrożni.
W poniższych wnioskach, za self-service będę przyjmował samodzielną pracę z danymi. Zakładam również, że praca z danymi w trybie self-service odnosić się powinna do wszystkich osób, dla których jest to zajęcie poboczne, zadanie wspierające ich w pracy. Trudno mówić o self-service BI w przypadku specjalistów analizy danych, dla których jest to po prostu zajęcie zawodowe.
Self-service dla użytkowników końcowych to możliwość pełnej eksploracji danych przygotowanych przez analityka. Możliwość szybkiego wygenerowania własnego spojrzenia, uzyskania odpowiedzi na własne, szybkie pytanie. Jest to możliwość łatwego podzielenia się wynikiem z innymi, możliwość własnego, wygodnego ustawienia monitorowania wybranych wskaźników.
Mniej self-service...
Ekstrakcja i przetwarzanie danych to ciężka praca. Dane są w różnych systemach, do których najpierw trzeba się dostać. Dane są niekompletne, dane mają błędy. Nie są spójne między źródłami. Brak im poprawnych połączeń (kluczy). Te same dane potrafią być przechowywane w kilku miejscach naraz (redundancja). Na doprowadzenie danych do formy nadającej się do raportowania trzeba poświęcić dużo czasu. Zajmuje to mniej czasu dopiero wtedy, gdy ma się odpowiednie umiejętności i doświadczenie.
... lub więcej self-service
Konsumpcja danych powinna być dostępna dla wszystkich. Łatwość konsumpcji oraz możliwość tworzenia własnych alternatywnych zestawień danych pozwoli szybciej dostawać odpowiedzi, oraz zmniejszyć nakład pracy na produkcję licznych kopii raportów. Tutaj self-service powinien działać w stu procentach.
Wykorzystałeś swój limit bezpłatnych treści
Pozostałe 80% artykułu dostępne jest dla zalogowanych użytkowników portalu. Zaloguj się, wybierz plan abonamentowy albo kup dostęp do artykułu/dokumentu.