Czy analityk powinien znać SQL, aby dobrze analizować dane u źródła? Nie musi. Z pewnością jest to pomocne, ale wystarczy opanować podstawową logikę tworzenia zapytań oraz zainstalować niezawodną aplikację KNIME, aby poradzić sobie bez znajomości tego języka.

Możliwość skorzystania z informacji pobranych bezpośrednio z bazy danych to dla każdego analityka nie lada gratka. Ma się wtedy pewność, że dane, które przyjmujemy do analizy, nie są w żaden sposób przetworzone, więc możemy korzystać z nich tak, jak sobie tylko wymarzymy. Jest tylko jeden drobiazg – jako analitycy niekoniecznie potrafimy samodzielnie pozyskiwać i przetwarzać dane z baz danych. Wolimy dostać jakiś plik z danymi, aby „poznęcać się” nad nimi w Excelu. Jednak w takim przypadku jesteśmy uzależnieni od innych osób, które dostarczają nam dane – od tych, które przygotowały moduły eksportujące zestawienia, od programistów. I od tego, czy zestawią nam właściwe dane w pożądany sposób.

Pamiętam, jak pewnego razu przyszedłem do programisty z prośbą o wyciągnięcie dla mnie pewnych danych z bazy. On spojrzał na mnie zmęczony, ponieważ to była moja kolejna wizyta u niego tego dnia. Po czym westchnął i powiedział, że w sumie mógłbym się nauczyć SQL. Tak też zrobiłem i już po dwóch dniach potrafiłem konstruować proste zapytania. Z czasem nabrałem w tym biegłości, ale gdybym dziś potrzebował sięgnąć bezpośrednio do bazy, użyłbym KNIME.

I tym podejściem chcę się dzisiaj podzielić. KNIME bowiem pozwala na pobranie i przetworzenie danych bezpośrednio z bazy, bez konieczności formułowania zapytań czy nawet znajomości ich składni. Oczywiście – taka wiedza nie zawadzi, ale w poniższych przykładach odnajdzie się nawet zupełny laik.

Zanim jednak rzucimy się w wir konstruowania zapytań w KNIME, szybkie przypomnienie, czym właściwie jest ta aplikacja. KNIME to darmowe narzędzie służące do przetwarzania danych, wykorzystywane zarówno w biznesie, jak i w badaniach naukowych. Jedną z jego głównych zalet jest to, że cały proces przetwarzania informacji ma postać graficzną, tak zwany workflow. Z kolei poszczególne punkty w tym schemacie to węzły, z angielskiego node. Tworzenie procesu odbywa się za pomocą klikania i przeciągania. Zainteresowanych możliwościami KNIME i szczegółami pracy w nim odsyłam do poprzednich numerów „Informacji Zarządczej”, gdzie opisałem podstawowe zagadnienia związane z tą aplikacją.

Wszystko, czego potrzebujemy do rozpoczęcia prac, to zainstalowany KNIME – można go pobrać za darmo ze strony aplikacji – oraz dane logowania do bazy danych. Jeśli w naszej bazie występuje więcej niż jedna tabela i są między nimi jakieś relacje, powinniśmy je również poznać. Jednak znajomość własnych danych to akurat podstawa pracy analityka.

Zaczynamy od wybrania węzła, który będzie łączył się bezpośrednio z naszą bazą. W bocznym oknie Node Repository wybieramy grupę Database, a w niej podgrupę Connector i to właśnie w niej będziemy szukać odpowiedniego węzła. Najprościej jest wybrać uniwersalny, nazywający się Database Connector – ale oczywiście możemy skorzystać z pewnej liczby węzłów sprofilowanych pod określone typy baz danych.

Przeciągamy wybrany węzeł do obszaru roboczego i klikamy go dwukrotnie. Na Rysunku 1 prezentuję, jak wygląda to w przypadku podłączania się do bazy MySQL za pomocą węzła Database Connector. W rozwijanym polu Database driver wybieramy rodzaj sterownika JDBC, dzięki któremu aplikacja Java może połączyć się z bazą danych. Jeśli korzystamy z węzła przeznaczonego dla określonego typu bazy danych, ten sterownik jest już domyślnie wybrany. Następnie w polu Database URL wpisujemy adres naszej bazy – jak widać, łącznie z jej portem (zamazałem szczegóły dotyczące nazwy bazy i dostawcy hostingu). Jako formę autoryzacji wpisujemy nazwę użytkownika oraz hasło – i gotowe.

Pozostałe 70% artykułu dostępne jest dla zalogowanych użytkowników serwisu.

Jeśli posiadasz aktywną prenumeratę przejdź do LOGOWANIA. Jeśli nie jesteś jeszcze naszym Czytelnikiem wybierz najkorzystniejszy WARIANT PRENUMERATY.

Zaloguj Zamów prenumeratę Kup dostęp do artykułu
Ulubione Drukuj

Zobacz również

Tylko on-line nr 18/2019

Jak graficznie przedstawiać dane – o budowie wykresów

CiRZ_2_15.jpg

Wykresy są niezbędnym dodatkiem do informacji zarządczej. Prezentowanie danych w postaci wykresów pozwala w czytelny sposób pokazać dane liczbowe, dzięki czemu łatwiej zauważyć pewne zależności czy odchylenia.

Czytaj więcej
Tylko on-line nr 18/2019

Wykresy mostowe jako sposób prezentacji elementów składowych odchyleń

CiRZ_3_2019_21.jpg

Wykresy mostowe (zwane też kaskadowymi lub schodkowymi) mają zastosowanie wszędzie tam, gdzie trzeba pokazać części składowe wykresu w postaci „schodków”, dzięki czemu w czytelny sposób uwidacznia się kluczowe pozycje, mające największe znaczenie dla prezentowanych danych.

Czytaj więcej
Tylko on-line nr 17/2019

Tabele – formatowanie liczb

CiRZ_231_35.jpg

Tabele są podstawowym narzędziem w Excelu. Bez nich nie uda się żadne zestawienie ani analiza. Wszystko jedno, czy pracuje się w obszarze controllingu, finansów czy rachunkowości, dane zawsze układa się w tabelach. Warto zatem poświęcić kilka chwil, aby dane prezentowane w tabeli były przejrzyste i czytelne. Pierwszym krokiem jest odpowiednie sformatowanie liczb, które są podstawą każdej tabeli.

Czytaj więcej

Przejdź do

Partnerzy

Reklama