22 / 11 / 2019

Istnieje wiele sposobów na przechowywanie danych dotyczących funkcjonowania organizacji. Typowym podejściem do rejestrowania danych transakcyjnych w przedsiębiorstwie jest zaimplementowanie bazy, w której będą przechowywane usystematyzowane dane o określonej strukturze. Przechowując dane w tabelach można zapanować nad sposobem ich przechowywania oraz ustalić relacje między innymi obiektami tak, aby miały odpowiedni kontekst biznesowy. Dobrze zaprojektowana baza danych oferuje spójność i integralność zawartych w niej informacji, ale wymaga od użytkownika, aby wprowadzane dane były zgodne z jej modelem.

Na różnych etapach rozwoju, firmy decydują się na wdrożenie takich narzędzi do przechowywania informacji, na jakie pozwalają dostępne w danym okresie narzędzia. Mając na uwadze kryterium kosztów lub funkcji, można wybrać spośród kilku dostępnych silników baz danych, między innymi:
• Microsoft SQL Server
• Access
• Oracle
• PostgreSQL
Alternatywa dla bazy danych
Nie zawsze jednak wszystkie dane w organizacji są przechowywane w bazie danych. Mimo obecności wielu systemów zarządzania informacją w przedsiębiorstwie, czasem wygodniej i szybciej jest zapisać część danych w postaci pliku arkusza kalkulacyjnego Excel lub pliku PDF. Decydując się na taką formę przechowywania informacji zazwyczaj mamy w zamiarach spełnienie bieżących, krótkoterminowych potrzeb. Na przykład:
• Eksport kontaktów z konta Google lub Microsoft Outlook,
• Pobieranie danych o klientach z naszego sklepu internetowego w postaci pliku CSV,
• Zapis pliku Excel z danymi sprzedażowymi otrzymanymi drogą mailową oraz zapisanie go na dysku sieciowym (np. OneDrive).
Dane zapisane w ten sposób mogą być na tyle duże i istotne, aby stanowić uzupełnienie danych przechowywanych w bazie danych. Chcąc przygotować analizy przechowywanych danych może się okazać, że zawierają podobne informacje, ale struktura oraz specyfika miejsca przechowywania każdego z nich różni się. Każdorazowe przekształcanie danych tak, aby miały wspólny model bywa zbyt pracochłonne i niedostatecznie efektywne, co może utrudnić proces dotarcia do informacji.
Power BI jako narzędzie integracji danych
Silną stroną Power BI jest możliwość integracji danych o z wielu źródeł o różnym typie. To rozbudowane narzędzie do budowy interaktywnych analiz pozwala utworzyć wspólny model danych i zagregować dane wielu źródeł (między innymi):
• BAZY DANYCH
- Microsoft SQL Server
- Access
- Oracle
- IBM Db2
- MySQL
- PostgreSQL
- Sybase
- SAP HANA
• USŁUGI ONLINE
- Strony internetowe z danymi
- SharePoint i OneDrive
- Active Directory
- Exchange Online
- Google Analytics
- Witryny Facebook
- NAV Dynamics
• PLIKI
- Arkusze kalkulacyjne Excel
- Pliki tekstowe i CSV
- Plik XML
- Plik JSON
Power BI pozwala na nawiązanie połączenia z wieloma źródłami danych jednocześnie oraz zaprojektowanie modelu danych dla analiz biznesowych. Przy pomocy edytora Power Query wbudowanego w Power BI można dodawać nowe źródła. Zostaną one przekształcane do postaci zapytań, które stanowią szablon dla tabel, które zostaną wypełnione danymi po załadowaniu z innych źródeł. Podczas nawiązywania połączenia Power BI rozpoznaje obiekty z danymi i umożliwia wybór elementów:

Następnie, zaimportowane obiekty są dostępne na liście zapytań edytora Power Query, które są poddawane transformacjom według ustalonego wzorca postępowania. Na tym etapie Power BI pozwala na utworzenie zestawu czynności przekształcających dane dla wybranego zapytania. Dzięki temu przy każdym pobraniu danych ze źródeł, dane wejściowe zostaną załadowane do modelu i przekształcone krok po kroku według zaprojektowanego schematu.

Co istotne, podczas obróbki danych Power BI nie ingeruje w strukturę źródła, z którego korzysta, lecz wykonuje operacje na własnym, lokalnym zestawie danych pobranym w zakresie ustalonym na etapie ekstrakcji, czyli wyodrębniania informacji. Następnie poddaje je transformacjom, takimi jak indeksowanie danych, zmiana typu danych w wybranej kolumnie, scalanie czy kolejność ich wyświetlania. Po ukończeniu projektowania, dane zostają załadowane do modelu w postaci tabel z danymi. Cecha ta czyni Power BI świetnym narzędziem w sytuacjach, kiedy nie chcemy wykonywać zmian na oryginalnym źródle, a załadować do innego miejsca i przekształcić je. Cecha ta jest istotna, zwłaszcza gdy nasze źródła różnią się zarówno technologią, na której są oparte, czy strukturami danych, które prezentują.
Aby ułatwić nawigację po źródłach danych dostępnych w modelu, Power BI umożliwia ustalenie pochodzenia obiektów z danymi. Widok zależności zapytań pozwala zlokalizować, z której z naszych baz danych, pliku lub źródła internetowego zapytanie skorzysta, aby utworzyć tabelę oraz który element w hierarchii ma być ładowany do modelu danych.

Dzięki agregacji danych z wielu źródeł, raporty przygotowywane przy użyciu Power BI mogą obejmować zakres szerszy niż tylko pojedyncza baza danych, co pozwala przygotować obszerniejsze analizy biznesowe. Dane autoryzacyjne do źródeł danych są zapisane w modelu danych i automatycznie wykorzystywane do nawiązania połączenia przy wywołaniu jednej procedury ładowania danych. W efekcie dane, które wcześniej były dostępne w wielu źródłach mogą zostać łatwo złączone i pobrane do wspólnego zestawu danych przetwarzanym w chmurze usługi Power BI lub zapisywane lokalnie na urządzeniu przy użyciu aplikacji Power BI Desktop.