Dodawaj, usuwaj i zmieniaj nazwy kolumn w R za pomocą Dplyr
W tym samouczku omówimy pakiet dplyr, który umożliwia sortowanie, filtrowanie, dodawanie i zmianę nazw kolumn w języku R.
W tym samouczku omówię dwa miejsca, w których można pisać formuły języka DAX. Te dwa miejsca to kolumny obliczeniowe i miary . Możesz obejrzeć pełny film tego samouczka na dole tego bloga.
Omówię każdy z nich naraz i zacznę od kolumn obliczeniowych.
Spis treści
Korzystanie z kolumn obliczeniowych
Kolumna obliczeniowa to dodatkowa kolumna, która nie istnieje w źródle nieprzetworzonych danych.
Oznacza to, że musimy dodać go fizycznie do Twojej tabeli danych.
W tym celu należy umieścić logikę formuły języka DAX w kolumnie , aby utworzyć tę dodatkową kolumnę. Jest to bardzo podobne do pracy w programie Excel i chcesz dodać kolejną kolumnę z formułą.
W tym przykładzie użyjemy tej tabeli faktów, która zawiera wszystkie transakcje sprzedaży w naszych sklepach detalicznych i dodamy cenę produktu.
Cena faktycznie istnieje już w Tabeli produktów tutaj, gdzie mamy pierwotną cenę sprzedaży i aktualną cenę.
Ale aby pokazać, jak utworzyć kolumnę obliczeniową, dodam ją również do tabeli sprzedaży.
W wielu z tych przykładów, zwłaszcza w przypadku kolumn obliczeniowych, tworzenie tych kolumn nie jest konieczne.
Jeśli pochodzisz ze środowiska programu Excel, możesz pomyśleć, że musisz, ale nie musisz tego robić w usłudze LuckyTemplates. Robię to tylko po to, aby pokazać, czym jest kolumna obliczeniowa.
Ale później pokażę ci, jak właściwie możesz używać miar do przeprowadzania tych obliczeń zamiast dodawać fizyczną kolumnę w tabeli danych.
Dodajmy więc cenę tutaj jako nasz pierwszy przykład.
Aby utworzyć kolumnę obliczeniową, otwórz wstążkę Modelowanie i wybierz opcję Nowa kolumna .
Zamierzam napisać tutaj całkiem prostą logikę, aby umieścić cenę w tej kolumnie. Nazwę ją Cena sprzedaży, a następnie użyję funkcji POWIĄZANE , aby odwołać się do nazwy kolumny.
W tym przypadku odniosę się do kolumny Aktualna cena . To da mi cenę sprzedaży za każdy sprzedany przedmiot.
Funkcja POWIĄZANE wprowadza cenę każdego produktu z osobna.
A potem moglibyśmy napisać tutaj nową kolumnę i nazwać ją Total Revenue . Korzystamy ze wzoru:
Całkowity przychód = sprzedaż [ilość] * sprzedaż [cena sprzedaży]
To tylko kilka przykładów tworzenia kolumny obliczeniowej.
Kolumny obliczeniowe można także tworzyć w dowolnej tabeli w modelu danych. Nie musi to być tylko tabela faktów lub tabela sprzedaży. Może również znajdować się wewnątrz tabel WYSZUKAJ.
Na przykład przeskakujemy do tej szczegółowej tabeli dat. Pomyśl o tych kolumnach jako o kolumnach, które będą filtrami miar języka DAX.
Kiedy patrzę na tę tabelę, widzę, że jest tu wymiar, który obecnie nie istnieje, a który chciałbym umieścić w niektórych moich wizualizacjach.
Aby pokazać inny sposób tworzenia kolumny obliczeniowej, użyję kolumny MonthName.
Nazwa miesiąca tutaj to pełny miesiąc, ale chcę tylko trzy pierwsze litery każdego miesiąca.
Więc przejdę do New Column na wstążce Modeling i nazwijmy tę kolumnę Short Month .
Zastosuję logikę, którą być może znasz z programu Excel. Zamierzam użyć LEWO, a następnie znaleźć nazwę mojego miesiąca i użyję tylko pierwszych trzech liter nazwy tego miesiąca .
Teraz, jeśli przejdziemy na bok, zobaczymy kolumnę Krótki miesiąc , w której mamy tylko trzy pierwsze litery każdego miesiąca.
Lubię to nazywać dodawaniem dodatkowych wymiarów do analizy, ponieważ zasadniczo stworzyliśmy kolejny filtr, którego możemy używać w każdej naszej analizie, którą przeprowadzamy od teraz.
Jeśli wrócimy do modelu danych, zobaczysz, że kolumna Krótki miesiąc istnieje teraz w naszej tabeli dat i może filtrować wszystko , co robimy w tej tabeli Sprzedaż.
Jeśli więc przeprowadzimy obliczenia i policzymy ilość, możemy teraz przefiltrować ją według krótkiego miesiąca.
Chciałbym powtórzyć, że nie zaleca się tworzenia tych kolumn tutaj, ponieważ faktycznie możemy utworzyć wszystkie te obliczenia w pamięci.
Tworząc miary, możemy wykonywać te wewnętrzne obliczenia bez konieczności fizycznego umieszczania ich w tabeli.
Jest to kluczowa rzecz do zapamiętania podczas nauki pisania formuły języka DAX na tabelach danych.
Korzystanie ze środków
Porozmawiajmy teraz o środkach.
Pomyśl o mierze jako wirtualnej kalkulacji. W rzeczywistości nie znajduje się wewnątrz twojego modelu, ale znajduje się na górze twojego modelu.
Kiedy używasz miary, idzie ona i wykonuje obliczenia tylko wtedy, gdy jej używasz.
W programie Excel za każdym razem, gdy uruchamiasz obliczenie w kolumnie lub w dowolnej komórce, jest ono cały czas przeliczane. Jednak w usłudze LuckyTemplates miara oblicza się sama tylko wtedy, gdy jest to konieczne.
Miara przypomina składowaną procedurę obliczeniową, która zostaje włączona tylko wtedy, gdy jest używana w wizualizacji.
Stwórzmy więc prostą miarę, aby podkreślić ten punkt. Najpierw zaznaczę tabelę sprzedaży, a następnie zaznaczę tam dowolną kolumnę.
Aby utworzyć nową miarę, przejdź do wstążki Modelowanie i kliknij opcję Nowa miara .
Kliknięcie ikony otwiera ten pasek formuły, na którym możesz wpisać swoją formułę:
Wstawię Całkowita sprzedana ilość , aby uzyskać sumę z kolumny Ilość w tabeli Sprzedaż.
Teraz mamy tę naprawdę prostą miarę, która praktycznie kończy swoje obliczenia.
Oblicza również wszystko w pamięci. Innymi słowy, jest to obliczenie całkowitej liczby przedmiotów, które sprzedaliśmy w tym czasie.
Kluczową rzeczą do zapamiętania jest to, że ta miara jest po prostu przechowywana w naszym modelu, ale w rzeczywistości nie uruchamia żadnych obliczeń, chyba że przeciągniemy ją na naszą stronę raportu. Następnie przejdzie i wykona obliczenia wirtualnie.
Tak więc w tym przypadku ta miara wirtualnie przechodzi do tabeli Sales, przechodzi do kolumny Quantity w tej tabeli, a następnie sumuje całą kolumnę.
W rzeczywistości nazywa się to miarą agregacji , którą wkrótce omówimy.
Teraz utworzę nową miarę i nazwę ją Total Sales . Następnie użyję funkcji iteracyjnej o nazwie SUMX , którą wkrótce wyjaśnię w innym modelu.
Odwołałem się do tabeli Sales i wymyśliłem tę formułę:
Całkowita sprzedaż = SUMX(Sprzedaż, Sprzedaż[Ilość] * POWIĄZANE(Produkty[Cena bieżąca] )
Jeśli pamiętasz, fizycznie nie umieściliśmy tej POWIĄZANEJ aktualnej ceny w tabeli danych. Ale w tym przypadku praktycznie umieszczam to w tabeli danych, włączając to do tej miary.
Następnie funkcja iteracyjna SUMX przechodzi do tabeli Sales i wybiera każdy pojedynczy wiersz w tabeli pomnożony przez ilość przez powiązaną aktualną cenę.
Ta całkowita sprzedaż da mi teraz wynik.
Możesz także wykonać formatowanie na karcie Modelowanie, gdzie typ danych znajduje się u góry.
Dowiedz się, jak zbierać zaznaczenia fragmentatora usługi LuckyTemplates do wykorzystania w ramach innych miar Umieszczanie numerów dni roboczych i dni weekendowych w tabeli dat w usłudze LuckyTemplates Wyświetlanie wyników do daty bieżącej lub określonej daty w usłudze LuckyTemplates
Wniosek
Omówiliśmy kolumny obliczeniowe i miary, w których można wpisać formułę języka DAX.
Kluczową rzeczą w przypadku kolumn obliczeniowych jest fizyczne umieszczenie kolumny danych w modelu. Jeśli robisz to czasami na niektórych większych tabelach, mogą to być bardzo duże kolumny.
Należy pamiętać, że te kolumny obliczeniowe mogą zajmować dużo pamięci w modelu.
Mogą zwiększyć rozmiar pliku i czasami mogą wpływać na wydajność w zależności od wielkości stołu.
Ale możesz temu przeciwdziałać, skutecznie stosując miary do wirtualnego wykonywania wielu z tych obliczeń. Nadal uzyskasz te same wyniki, które uzyskasz, pisząc te kolumny obliczeniowe .
Mam nadzieję, że ten samouczek znacznie przybliży Ci dwa miejsca, w których możesz pisać formuły języka DAX, oraz zagadnienia związane z pisaniem formuł języka DAX.
Pomoże Ci to również zrozumieć, jak włączyć język DAX do analizy w usłudze LuckyTemplates.
Ciesz się recenzowaniem tego.
W tym samouczku omówimy pakiet dplyr, który umożliwia sortowanie, filtrowanie, dodawanie i zmianę nazw kolumn w języku R.
Odkryj różnorodne funkcje zbierania, które można wykorzystać w Power Automate. Zdobądź praktyczne informacje o funkcjach tablicowych i ich zastosowaniu.
Z tego samouczka dowiesz się, jak ocenić wydajność kodów DAX przy użyciu opcji Uruchom test porównawczy w DAX Studio.
Czym jest self w Pythonie: przykłady z życia wzięte
Dowiesz się, jak zapisywać i ładować obiekty z pliku .rds w R. Ten blog będzie również omawiał sposób importowania obiektów z R do LuckyTemplates.
Z tego samouczka języka kodowania DAX dowiesz się, jak używać funkcji GENERUJ i jak dynamicznie zmieniać tytuł miary.
W tym samouczku omówiono sposób korzystania z techniki wielowątkowych wizualizacji dynamicznych w celu tworzenia szczegółowych informacji na podstawie dynamicznych wizualizacji danych w raportach.
W tym artykule omówię kontekst filtra. Kontekst filtrowania to jeden z głównych tematów, z którym każdy użytkownik usługi LuckyTemplates powinien zapoznać się na początku.
Chcę pokazać, jak usługa online LuckyTemplates Apps może pomóc w zarządzaniu różnymi raportami i spostrzeżeniami generowanymi z różnych źródeł.
Dowiedz się, jak obliczyć zmiany marży zysku przy użyciu technik, takich jak rozgałęzianie miar i łączenie formuł języka DAX w usłudze LuckyTemplates.