W pracy z danymi często napotykamy na wiele problemów. Najważniejsze to rozproszenie danych w różnych systemach oraz ich jakość. Rozproszone dane nie pozwalają nam spojrzeć na wszystkie aspekty biznesu jednocześnie. Dane z systemów księgowych, CRM, sprzedaży, dane trzymane w plikach lokalnych użytkowników – analiza tych danych i wyciąganie z nich właściwych wniosków staje się w takim środowisku bardzo trudne. W takiej sytuacji pojawia się pytanie: jak to wszystko połączyć?

Narzędzia ETL – czym są i jak zacząć z nich korzystać?

Czym jest GIGO?

Optymalnym efektem byłaby jedna baza danych, zawierająca wszystkie dane, tak abyśmy mogli w prosty sposób przetwarzać je, wizualizować i analizować.

Drugim aspektem problemów związanych z danymi jest ich jakość. Ten problem doskonale przedstawia zdanie: Garbage in = Garbage out (śmietnik na wejściu = śmietnik na wyjściu). Ten przemawiający do wyobraźni termin oznacza, że jeśli nie zadbamy o jakość danych na wejściu do narzędzia analitycznego, na końcu otrzymamy równie mało jakościowy efekt.

Specyfika ETL

ETL jest skrótem, na który składają się trzy etapy procesowania danych, aby finalnie mieć dane dostępne w jednym dobrym jakościowo źródle. Akronim ten oznacza:

  • E(kstrakcję), czyli wyciągnięcie danych z rozproszonych źródeł;
  • T(ransformację), czyli ich przekształcenie, oczyszczenie oraz implementację reguł biznesowych;
  • L(Ładowanie) danych do jednego źródła, np. do hurtowni danych.

Pozostałe 83% artykułu dostępne jest dla zalogowanych użytkowników serwisu.

Jeśli posiadasz aktywną prenumeratę przejdź do LOGOWANIA. Jeśli nie jesteś jeszcze naszym Czytelnikiem wybierz najkorzystniejszy WARIANT PRENUMERATY.

Zaloguj Zamów prenumeratę Kup dostęp do artykułu

Możesz zobaczyć ten artykuł, jak i wiele innych w naszym portalu Controlling 24. Wystarczy, że klikniesz tutaj.

Zobacz również

Tekst otwarty nr 27/2021

Zmiana układu danych w Power Query

Zmiana układu danych w Power Query

Analizując dane, czasem musimy stawić czoło przeciwnościom losu. Zdarzeniom, które spowalniają nas w drodze do wniosków końcowych. Zdarza się jednak przeciwnik, który nie powstał przypadkiem, a stworzyła go jakaś nieżyczliwa nam dusza. Bo jak inaczej patrzeć na dane, które ktoś niewłaściwie ułożył?

Czytaj więcej

Dlaczego kolor jest ważny? Kolory a wizualizacja danych

Dlaczego kolor jest ważny? Kolory a wizualizacja danych

Analiza wizualna to sposób przedstawiania danych, gdzie poprzez wzrok, nasz najbardziej rozwinięty zmysł, możemy czytać dane w postaci wizualnej. Za pomocą wyróżniania w sposób graficzny elementów istotnych dla analizy, nasze oczy pomagają nam w analizie wykresów.

Czytaj więcej

Przejdź do

Partnerzy

Reklama