Gdzie w analityce jest miejsce na Self Service?
Do jednej z sal konferencji Data Science Summit w Warszawie szło się długim korytarzem. Miał się w niej odbyć wykład na temat self-service w Business Intelligence. Korytarz był oflankowany pracownikami firm konsultingowych i firm z branży IT. Wszyscy oni, obłożeni gadżetami i plakatami, szukali kandydatów na stanowiska: „Specjalista od przetwarzania danych”, „Data steward”, „Inżynier danych”. Prowadzący prelekcję, wykładowca Politechniki Rzeszowskiej, przyszedł do sali tą samą drogą. Po wejściu zadał pytanie: Proszę Państwa, skoro poszukiwanych jest tylu specjalistów od przetwarzania danych, to czy sformułowanie „Self-Serivce BI” ma sens? To pytanie uświadomiło mi, że hasła samoobsługowości w analityce danych są często nadużywane. Rzeczywistość jest trochę bardziej skomplikowana niż da się to przedstawić w krótkim haśle marketingowym.
Zgadzam się z hasłem self-service bezwarunkowo, jeżeli rozumiemy pod nim niski próg wejścia, czyli łatwość samodzielnego uruchomienia i rozpoczęcia przygody z analizami w narzędziu lepiej do tego stworzonym niż Excel. Nie potrzeba specjalistycznej wiedzy, by zacząć przygodę we współczesnych narzędziach BI. Jeżeli natomiast pod self-service chcemy rozumieć samoobsługowość w zaspokajaniu pełni potrzeb analitycznych organizacji, to musimy być ostrożni.
W poniższych wnioskach, za self-service będę przyjmował samodzielną pracę z danymi. Zakładam również, że praca z danymi w trybie self-service odnosić się powinna do wszystkich osób, dla których jest to zajęcie poboczne, zadanie wspierające ich w pracy. Trudno mówić o self-service BI w przypadku specjalistów analizy danych, dla których jest to po prostu zajęcie zawodowe.
Self-service dla użytkowników końcowych to możliwość pełnej eksploracji danych przygotowanych przez analityka. Możliwość szybkiego wygenerowania własnego spojrzenia, uzyskania odpowiedzi na własne, szybkie pytanie. Jest to możliwość łatwego podzielenia się wynikiem z innymi, możliwość własnego, wygodnego ustawienia monitorowania wybranych wskaźników.
Mniej self-service...
Ekstrakcja i przetwarzanie danych to ciężka praca. Dane są w różnych systemach, do których najpierw trzeba się dostać. Dane są niekompletne, dane mają błędy. Nie są spójne między źródłami. Brak im poprawnych połączeń (kluczy). Te same dane potrafią być przechowywane w kilku miejscach naraz (redundancja). Na doprowadzenie danych do formy nadającej się do raportowania trzeba poświęcić dużo czasu. Zajmuje to mniej czasu dopiero wtedy, gdy ma się odpowiednie umiejętności i doświadczenie.
Wykorzystałeś swój limit bezpłatnych treści
Pozostałe 82% artykułu dostępne jest dla zalogowanych użytkowników portalu. Zaloguj się, wybierz plan abonamentowy albo kup dostęp do artykułu/dokumentu.