W poprzednim numerze IZ poznaliśmy sposoby wczytywania danych do KNIME. Możliwości jest sporo, ale proces eksploracji danych można rozpocząć nawet od przeciągnięcia dowolnej liczby plików z danymi (np. xlsx, csv) do przestrzeni workflow i dostosowania opcji odczytu w konfiguracji węzła. Zwykle na tym etapie mamy do czynienia z danymi z różnych źródeł o niezależnej strukturze, z brakującymi lub błędnymi wartościami.

KNIME Analytics Platform – przygotowanie danych do analizy

Modelowanie procesu data mining na niesprawdzonych danych (ang. raw data) nie jest najlepszym pomysłem, tym bardziej jeśli wyniki analizy mogą mieć realny wpływ na decyzje biznesowe w organizacji.

Poza tym już Arystoteles wspominał, że mały błąd na początku staje się wielkim na końcu. Co więcej, prawie zawsze będziemy potrzebowali w jakiś sposób oczyszczać, przekształcać, grupować, agregować i kategoryzować dane. W końcu w systemach informatycznych gromadzone są ogromne ilości danych, więc precyzyjne analizy muszą być poprzedzone procesem czyszczenia i wstępnego przetwarzania danych (ang. cleaning and preprocessing data).

W niniejszej, trzeciej części cyklu na temat analiz data mining w KNIME przedstawimy najczęściej używane węzły do wykonywania przekształceń. W pierwszej kolejności skupimy się na kolumnach. Wszystkie węzły z tej kategorii dostępne są w widoku repozytorium w grupie „Manipulation” i podgrupie „Column”.

Pozostałe 78% artykułu dostępne jest dla zalogowanych użytkowników serwisu.

Jeśli posiadasz aktywną prenumeratę przejdź do LOGOWANIA. Jeśli nie jesteś jeszcze naszym Czytelnikiem wybierz najkorzystniejszy WARIANT PRENUMERATY.

Zaloguj Zamów prenumeratę Kup dostęp do artykułu

Możesz zobaczyć ten artykuł, jak i wiele innych w naszym portalu Controlling 24. Wystarczy, że klikniesz tutaj.

Zobacz również

Tylko on-line nr 29/2021

SaaS – blaski i cienie modelu

SaaS – blaski i cienie modelu

Trudno wyobrazić sobie funkcjonowanie współczesnych przedsiębiorstw bez wykorzystania rozwiązań opartych na chmurze. W tej technologii działają już nie tylko proste aplikacje biurowe czy księgowe, lecz również złożone systemy służące do zarządzania całą organizacją lub wybranym jej segmentem. Jeszcze kilka lat temu przedsiębiorstwa z dużą ostrożnością podchodziły do oprogramowania utrzymywanego na serwerze, którego fizyczna lokalizacja znajduje się poza firmą, obawiając się chociażby o bezpieczeństwo czy dostępność danych. Dziś usługi dostarczane w modelu SaaS (Software as a Service) są niemal standardem. Jak każda technologia, tak i SaaS ma swoje atuty i słabości. Kiedy warto stosować ten model? Na jakie inne rozwiązania chmurowe warto zwrócić uwagę?

Czytaj więcej

Raporty na posiedzenia zarządu – przykłady dobrych praktyk w narzędziach BI

Raporty na posiedzenia zarządu – przykłady dobrych praktyk w narzędziach BI

Początek spotkania zarządu to czas, który jest godziną zero nie tylko dla osób zasiadających na spotkaniu, lecz także – niejednokrotnie – dla licznej grupy ludzi odpowiedzialnych za przygotowanie materiałów omawianych „na zarządzie”. Niezależnie od tego, z jakich narzędzi analitycznych korzysta się w organizacji, w większości przypadków jedynym akceptowalnym formatem prezentacji jest PowerPoint. Wynika to w dużej mierze z przyzwyczajenia do narzędzia, łatwości obsługi oraz z tego, że PowerPoint jest zazwyczaj zainstalowany na wszystkich komputerach. Bez względu na to, czy spotkanie odbywa się w formie zdalnej, czy w biurze, każdy, kto dostanie plik z gotową prezentacją, otworzy go jednym kliknięciem.

Czytaj więcej

Przejdź do

Partnerzy

Reklama

Polityka cookies

Dalsze aktywne korzystanie z Serwisu (przeglądanie treści, zamknięcie komunikatu, kliknięcie w odnośniki na stronie) bez zmian ustawień prywatności, wyrażasz zgodę na przetwarzanie danych osobowych przez EXPLANATOR oraz partnerów w celu realizacji usług, zgodnie z Polityką prywatności. Możesz określić warunki przechowywania lub dostępu do plików cookies w Twojej przeglądarce.

Usługa Cel użycia Włączone
Pliki cookies niezbędne do funkcjonowania strony Nie możesz wyłączyć tych plików cookies, ponieważ są one niezbędne by strona działała prawidłowo. W ramach tych plików cookies zapisywane są również zdefiniowane przez Ciebie ustawienia cookies. TAK
Pliki cookies analityczne Pliki cookies umożliwiające zbieranie informacji o sposobie korzystania przez użytkownika ze strony internetowej w celu optymalizacji jej funkcjonowania, oraz dostosowania do oczekiwań użytkownika. Informacje zebrane przez te pliki nie identyfikują żadnego konkretnego użytkownika.
Pliki cookies marketingowe Pliki cookies umożliwiające wyświetlanie użytkownikowi treści marketingowych dostosowanych do jego preferencji, oraz kierowanie do niego powiadomień o ofertach marketingowych odpowiadających jego zainteresowaniom, obejmujących informacje dotyczące produktów i usług administratora strony i podmiotów trzecich. Jeśli zdecydujesz się usunąć lub wyłączyć te pliki cookie, reklamy nadal będą wyświetlane, ale mogą one nie być odpowiednie dla Ciebie.