unity wiedza

Czas czytania: 4 minut

Integracja danych z różnych źródeł w Power BI

Istnieje wiele sposobów na przechowywanie danych dotyczących funkcjonowania organizacji. Typowym podejściem do rejestrowania danych transakcyjnych w przedsiębiorstwie jest zaimplementowanie bazy, w której będą przechowywane usystematyzowane dane o określonej strukturze. Przechowując dane w tabelach można zapanować nad sposobem ich przechowywania oraz ustalić relacje między innymi obiektami tak, aby miały odpowiedni kontekst biznesowy. Dobrze zaprojektowana baza danych oferuje spójność i integralność zawartych w niej informacji, ale wymaga od użytkownika, aby wprowadzane dane były zgodne z jej modelem.

Na różnych etapach rozwoju, firmy decydują się na wdrożenie takich narzędzi do przechowywania informacji, na jakie pozwalają dostępne w danym okresie narzędzia. Mając na uwadze kryterium kosztów lub funkcji, można wybrać spośród kilku dostępnych silników baz danych, między innymi:

• Microsoft SQL Server

• Access

• Oracle

• PostgreSQL

Alternatywa dla bazy danych

Nie zawsze jednak wszystkie dane w organizacji są przechowywane w bazie danych. Mimo obecności wielu systemów zarządzania informacją w przedsiębiorstwie, czasem wygodniej i szybciej jest zapisać część danych w postaci pliku arkusza kalkulacyjnego Excel lub pliku PDF. Decydując się na taką formę przechowywania informacji zazwyczaj mamy w zamiarach spełnienie bieżących, krótkoterminowych potrzeb. Na przykład:

• Eksport kontaktów z konta Google lub Microsoft Outlook,

• Pobieranie danych o klientach z naszego sklepu internetowego w postaci pliku CSV,

• Zapis pliku Excel z danymi sprzedażowymi otrzymanymi drogą mailową oraz zapisanie go na dysku sieciowym (np. OneDrive).

Dane zapisane w ten sposób mogą być na tyle duże i istotne, aby stanowić uzupełnienie danych przechowywanych w bazie danych. Chcąc przygotować analizy przechowywanych danych może się okazać, że zawierają podobne informacje, ale struktura oraz specyfika miejsca przechowywania każdego z nich różni się. Każdorazowe przekształcanie danych tak, aby miały wspólny model bywa zbyt pracochłonne i niedostatecznie efektywne, co może utrudnić proces dotarcia do informacji.

Power BI jako narzędzie integracji danych

Silną stroną Power BI jest możliwość integracji danych o z wielu źródeł o różnym typie. To rozbudowane narzędzie do budowy interaktywnych analiz pozwala utworzyć wspólny model danych i zagregować dane wielu źródeł (między innymi):

• BAZY DANYCH

  •  Microsoft SQL Server
  •  Access
  •  Oracle
  •  IBM Db2
  •  MySQL
  •  PostgreSQL
  •  Sybase
  •  SAP HANA

• USŁUGI ONLINE

  •  Strony internetowe z danymi
  •  SharePoint i OneDrive
  •  Active Directory
  •  Exchange Online
  •  Google Analytics
  •  Witryny Facebook
  •  NAV Dynamics

• PLIKI

  •  Arkusze kalkulacyjne Excel
  •  Pliki tekstowe i CSV
  •  Plik XML
  •  Plik JSON
  •  PDF

Power BI pozwala na nawiązanie połączenia z wieloma źródłami danych jednocześnie oraz zaprojektowanie modelu danych dla analiz biznesowych. Przy pomocy edytora Power Query wbudowanego w Power BI można dodawać nowe źródła.  Zostaną one przekształcane do postaci zapytań, które stanowią szablon dla tabel, które zostaną wypełnione danymi po załadowaniu z innych źródeł. Podczas nawiązywania połączenia Power BI rozpoznaje obiekty z danymi i umożliwia wybór elementów:

Wybór obiektów z bazy danych

Następnie, zaimportowane obiekty są dostępne na liście zapytań edytora Power Query, które są poddawane transformacjom według ustalonego wzorca postępowania. Na tym etapie Power BI pozwala na utworzenie zestawu czynności przekształcających dane dla wybranego zapytania. Dzięki temu przy każdym pobraniu danych ze źródeł, dane wejściowe zostaną załadowane do modelu i przekształcone krok po kroku według zaprojektowanego schematu.

Kroki obróbki danych

Co istotne, podczas obróbki danych Power BI nie ingeruje w strukturę źródła, z którego korzysta, lecz wykonuje operacje na własnym, lokalnym zestawie danych pobranym w zakresie ustalonym na etapie ekstrakcji, czyli wyodrębniania informacji. Następnie poddaje je transformacjom, takimi jak indeksowanie danych, zmiana typu danych w wybranej kolumnie, scalanie czy kolejność ich wyświetlania. Po ukończeniu projektowania, dane zostają załadowane do modelu w postaci tabel z danymi. Cecha ta czyni Power BI świetnym narzędziem w sytuacjach, kiedy nie chcemy wykonywać zmian na oryginalnym źródle, a załadować do innego miejsca i przekształcić je. Cecha ta jest istotna, zwłaszcza gdy nasze źródła różnią się zarówno technologią, na której są oparte, czy strukturami danych, które prezentują.

Aby ułatwić nawigację po źródłach danych dostępnych w modelu, Power BI umożliwia ustalenie pochodzenia obiektów z danymi. Widok zależności zapytań pozwala zlokalizować, z której z naszych baz danych, pliku lub źródła internetowego zapytanie skorzysta, aby utworzyć tabelę oraz który element w hierarchii ma być ładowany do modelu danych.

Widok zależności zapytań

Dzięki agregacji danych z wielu źródeł, raporty przygotowywane przy użyciu Power BI mogą obejmować zakres szerszy niż tylko pojedyncza baza danych, co pozwala przygotować obszerniejsze analizy biznesowe. Dane autoryzacyjne do źródeł danych są zapisane w modelu danych i automatycznie wykorzystywane do nawiązania połączenia przy wywołaniu jednej procedury ładowania danych. W efekcie dane, które wcześniej były dostępne w wielu źródłach mogą zostać łatwo złączone i pobrane do wspólnego zestawu danych przetwarzanym w chmurze usługi Power BI lub zapisywane lokalnie na urządzeniu przy użyciu aplikacji Power BI Desktop.

unity

unity

Skontaktuj się z profesjonalnym doradcą IT

Napisz do nas

Wyrażam zgodę na przetwarzanie danych osobowych na zasadach określonych w polityce prywatności. Jeśli nie wyrażasz zgody na wykorzystywanie cookies we wskazanych w niej celach, w tym do profilowania, prosimy o wyłącznie cookies w przeglądarce lub opuszczenie serwisu. więcej

Akceptuj