Scalanie rozmyte w Power Query
Scalanie w Power Query jest narzędziem, które pozwala w bardzo sprytny sposób połączyć ze sobą dwie lub więcej tabel. Scalanie działa podobnie jak funkcja WYSZUKAJ.PIONOWO() w Excelu, można też powiedzieć, że jest odpowiednikiem komendy JOIN w języku SQL. Krótko mówiąc, chodzi o to, aby jednemu rekordowi z jednej tabeli przyporządkować odpowiedni rekord z innej tabeli na podstawie pewnych wspólnych wartości.
Dla przykładu – w jednej tabeli możemy mieć dane dotyczące klientów (m.in.: identyfikator klienta, nazwę, siedzibę, datę podpisania umowy itd.), a w drugiej będziemy mieć dane dotyczące wystawionych faktur (zawierające m.in. identyfikator klienta, numer faktury oraz jej wartość). Na podstawie tych danych chcielibyśmy zrobić raport, który pokaże, jaka była łączna wartość sprzedaży w podziale na miejscowości lub kraje będące siedzibami klientów.
Musimy zatem przyporządkować do każdej faktury siedzibę klienta. Zamiast wykorzystywać funkcję WYSZUKAJ.PIONOWO() można do tego użyć scalania. To rozwiązanie będzie mieć ogromną zaletę – jeżeli będziemy chcieli dopasowywać rekordy po więcej niż jednej wartości, to przy scalaniu nie będzie z tym najmniejszego problemu. WYSZUKAJ.PIONOWO() już na to nam nie pozwoli (nie mówiąc o takim ograniczeniu, że szukana wartość musi być w pierwszej kolumnie od lewej w tabeli bazowej).
Sprawa jednak nieco się skomplikuje, jeżeli okaże się, że dane znajdujące się w dwóch tabelach niezupełnie do siebie pasują. Może to wynikać chociażby z popełnionych błędów literowych. Wtedy właśnie przyda się nam scalanie rozmyte.
Przykładowe dane
Trzymając się powyższego przykładu z klientami i wystawionymi fakturami, przyjmijmy, że tabela z klientami wygląda tak, jak pokazuje to Rysunek 1. Załóżmy także, że numerem identyfikacyjnym dla klienta jest jego nazwa.
Natomiast tabela z fakturami wygląda tak, jak pokazuje to Rysunek 2.
Na Rysunku 2 widać, że nazwy klientów są wielokrotnie wpisane z różnymi błędami (m.in. brakuje niektórych liter lub jest ich zbyt dużo, pojawiają się niepotrzebne spacje – przed pierwszym bądź za ostatnim słowem albo pomiędzy słowami). Te wszystkie błędy powodują, że „zwykłe” scalanie nie będzie w stanie dopasować do siebie rekordów, jeśli brać jako klucz kolumnę z nazwą klienta.
Wykorzystałeś swój limit bezpłatnych treści
Pozostałe 71% artykułu dostępne jest dla zalogowanych użytkowników portalu. Zaloguj się, wybierz plan abonamentowy albo kup dostęp do artykułu/dokumentu.