Nie znam SQL i co teraz? Zainstaluję KNIME!
Czy analityk powinien znać SQL, aby dobrze analizować dane u źródła? Nie musi. Z pewnością jest to pomocne, ale wystarczy opanować podstawową logikę tworzenia zapytań oraz zainstalować niezawodną aplikację KNIME, aby poradzić sobie bez znajomości tego języka.
Możliwość skorzystania z informacji pobranych bezpośrednio z bazy danych to dla każdego analityka nie lada gratka. Ma się wtedy pewność, że dane, które przyjmujemy do analizy, nie są w żaden sposób przetworzone, więc możemy korzystać z nich tak, jak sobie tylko wymarzymy. Jest tylko jeden drobiazg – jako analitycy niekoniecznie potrafimy samodzielnie pozyskiwać i przetwarzać dane z baz danych. Wolimy dostać jakiś plik z danymi, aby „poznęcać się” nad nimi w Excelu. Jednak w takim przypadku jesteśmy uzależnieni od innych osób, które dostarczają nam dane – od tych, które przygotowały moduły eksportujące zestawienia, od programistów. I od tego, czy zestawią nam właściwe dane w pożądany sposób.
Pamiętam, jak pewnego razu przyszedłem do programisty z prośbą o wyciągnięcie dla mnie pewnych danych z bazy. On spojrzał na mnie zmęczony, ponieważ to była moja kolejna wizyta u niego tego dnia. Po czym westchnął i powiedział, że w sumie mógłbym się nauczyć SQL. Tak też zrobiłem i już po dwóch dniach potrafiłem konstruować proste zapytania. Z czasem nabrałem w tym biegłości, ale gdybym dziś potrzebował sięgnąć bezpośrednio do bazy, użyłbym KNIME.
I tym podejściem chcę się dzisiaj podzielić. KNIME bowiem pozwala na pobranie i przetworzenie danych bezpośrednio z bazy, bez konieczności formułowania zapytań czy nawet znajomości ich składni. Oczywiście – taka wiedza nie zawadzi, ale w poniższych przykładach odnajdzie się nawet zupełny laik.
Zanim jednak rzucimy się w wir konstruowania zapytań w KNIME, szybkie przypomnienie, czym właściwie jest ta aplikacja. KNIME to darmowe narzędzie służące do przetwarzania danych, wykorzystywane zarówno w biznesie, jak i w badaniach naukowych. Jedną z jego głównych zalet jest to, że cały proces przetwarzania informacji ma postać graficzną, tak zwany workflow. Z kolei poszczególne punkty w tym schemacie to węzły, z angielskiego node. Tworzenie procesu odbywa się za pomocą klikania i przeciągania. Zainteresowanych możliwościami KNIME i szczegółami pracy w nim odsyłam do poprzednich numerów „Informacji Zarządczej”, gdzie opisałem podstawowe zagadnienia związane z tą aplikacją.
Wszystko, czego potrzebujemy do rozpoczęcia prac, to zainstalowany KNIME – można go pobrać za darmo ze strony aplikacji – oraz dane logowania do bazy danych. Jeśli w naszej bazie występuje więcej niż jedna tabela i są między nimi jakieś relacje, powinniśmy je również poznać. Jednak znajomość własnych danych to akurat podstawa pracy analityka.
Zaczynamy od wybrania węzła, który będzie łączył się bezpośrednio z naszą bazą. W bocznym oknie Node Repository wybieramy grupę Database, a w niej podgrupę Connector i to właśnie w niej będziemy szukać odpowiedniego węzła. Najprościej jest wybrać uniwersalny, nazywający się Database Connector – ale oczywiście możemy skorzystać z pewnej liczby węzłów sprofilowanych pod określone typy baz danych.
Przeciągamy wybrany węzeł do obszaru roboczego i klikamy go dwukrotnie. Na Rysunku 1 prezentuję, jak wygląda to w przypadku podłączania się do bazy MySQL za pomocą węzła Database Connector. W rozwijanym polu Database driver wybieramy rodzaj sterownika JDBC, dzięki któremu aplikacja Java może połączyć się z bazą danych. Jeśli korzystamy z węzła przeznaczonego dla określonego typu bazy danych, ten sterownik jest już domyślnie wybrany. Następnie w polu Database URL wpisujemy adres naszej bazy – jak widać, łącznie z jej portem (zamazałem szczegóły dotyczące nazwy bazy i dostawcy hostingu). Jako formę autoryzacji wpisujemy nazwę użytkownika oraz hasło – i gotowe.
Wykorzystałeś swój limit bezpłatnych treści
Pozostałe 70% artykułu dostępne jest dla zalogowanych użytkowników portalu. Zaloguj się, wybierz plan abonamentowy albo kup dostęp do artykułu/dokumentu.