Dodawaj, usuwaj i zmieniaj nazwy kolumn w R za pomocą Dplyr
W tym samouczku omówimy pakiet dplyr, który umożliwia sortowanie, filtrowanie, dodawanie i zmianę nazw kolumn w języku R.
Pozwól, że omówię niektóre zaawansowane przekształcenia w usłudze LuckyTemplates za pomocą edytora zapytań. Możesz obejrzeć pełny film tego samouczka na dole tego bloga.
Pamiętaj, że możesz łączyć różne działania w edytorze zapytań, aby w pełni zoptymalizować swoje modele. Wystarczy zapoznać się z różnymi przekształceniami w usłudze LuckyTemplates i dowiedzieć się, w jakich scenariuszach są one przydatne.
Spis treści
Eksplorowanie różnych transformacji w usłudze LuckyTemplates
Istnieje wiele sposobów eksplorowania różnych przekształceń, które można wykonać w usłudze LuckyTemplates.
Jednym ze sposobów na to jest kliknięcie prawym przyciskiem myszy dowolnej kolumny i przejrzenie różnych opcji, które się pojawią.
Możesz również spojrzeć na górę strony i użyć wstążki, aby zobaczyć dostępne przekształcenia, które możesz wykonać. Te same działania, które zobaczysz po kliknięciu prawym przyciskiem myszy, można również znaleźć w tym obszarze, a także kilka dodatkowych działań, takich jak dodanie kolumny.
Możesz także kliknąć ikonę w lewej górnej części tabeli , a pojawi się lista przekształceń.
To menu pokaże również dodatkowe przekształcenia kolumn i wierszy, takie jak Zachowaj górne rzędy, Zachowaj dolne rzędy, Zachowaj zakres wierszy itp. Pozwala również na filtrowanie.
Możesz także skorzystać z listy rozwijanej znajdującej się po prawej stronie nazwy kolumny . Spowoduje to wyświetlenie dodatkowych opcji filtrowania.
Pamiętaj, że bez względu na to, gdzie uzyskasz dostęp do tych przekształceń, każda transformacja, którą wykonasz, zostanie zarejestrowana w Zastosowanych krokach tutaj po prawej stronie.
Dodawanie danych ze strony internetowej do swojej tabeli
Aby pokazać przykład niektórych zaawansowanych transformacji, dodam trochę danych do poniższej tabeli.
Dodaję te dane do dodatkowej analizy, której w tej chwili nie daje mi moja tabela. W takim przypadku chcę zaktualizować dane dotyczące populacji w Kalifornii, ponieważ dane w mojej tabeli Lokalizacje są nieaktualne.
Na początek przeszukam Google dane demograficzne z Kalifornii.
Otrzymuję tutaj kilka wyników, więc wybieram ten z california-demographics.com.
Pokazuje wiele informacji, ale dane, których szukam, znajdują się tutaj w tym linku, który mówi „Zobacz wszystkie miasta Kalifornii według populacji”.
Teraz mam zestawienie wszystkich różnych miast i ich populacji.
Zamierzam skopiować adres URL tej strony.
Następnie wrócę do edytora zapytań.
Pod wstążką Strona główna zamierzam kliknąć Nowe źródło , a następnie Web .
To, co tutaj robię, to zbieranie danych z witryny, którą odwiedziłem wcześniej.
Pamiętaj, że jeśli zamierzasz zrobić to samo w swoim modelu, musisz upewnić się, że dane są prezentowane w dobrym formacie.
Więc po prostu wkleję adres URL, który skopiowałem wcześniej w wyznaczonym miejscu.
Gdy kliknę OK, pojawi się to okno. Muszę tylko kliknąć Połącz.
Tylko szybka wskazówka tutaj. Ponieważ otrzymujesz dane online, musisz upewnić się, że Twoje połączenie internetowe jest całkiem dobre. W przeciwnym razie uzyskanie danych może zająć dużo czasu.
Teraz, gdy mam połączenie, w tym oknie pojawiła się tabela, którą widziałem wcześniej na tej stronie.
Takie dane pojawią się jako migawka z oryginalnego źródła. Więc kiedy osadzę to w zapytaniu, automatycznie będzie pobierać świeże dane z witryny za każdym razem, gdy odświeżę moją tabelę . A kiedy dane na stronie zostaną zaktualizowane, tabela również zostanie zaktualizowana.
Przekształcanie tabeli za pomocą nowych danych
Nowe dane, które dodałem, znajdują się teraz w sekcji Inne zapytania w tabeli 1.
Wspomniałem wcześniej, że chcę, aby każdy fragment danych w mojej tabeli był wyraźnie oznaczony, więc oczywiście muszę zmienić nazwę tabeli 1.
Jednym ze sposobów na to jest skorzystanie z sekcji Właściwości po prawej stronie. Aby pokazać, jak to się robi, zmienię nazwę tej tabeli na California Popn Data.
Mogę również zmienić nazwę , klikając ją dwukrotnie w lewym okienku . Tym razem zmienię nazwę tej samej tabeli na nazwę CA Population Data.
Nie chcę, aby pozostawało to w obszarze Inne zapytania, ponieważ jest to tabela pomocnicza, a ja już mam istniejący folder dla zapytań pomocniczych. Wszystko, co muszę zrobić, to przeciągnąć tę tabelę do odpowiedniego folderu.
Zanim przejdę dalej, chcę dokładnie sprawdzić, co zawiera ta nowa tabela pomocnicza.
Pokazuje rangę, miasto i populację.
Teraz sprawdzę moją tabelę Lokalizacje .
Widzę, że nazwy miast z mojej tabeli Lokalizacje są takie same jak nazwy miast w tabeli Dane populacji CA.
Z tego powodu posiadanie dwóch oddzielnych tabel nie ma sensu. Więc zamierzam je połączyć.
Wspomniałem wcześniej, że moja tabela Lokalizacje zawiera nieaktualne dane dotyczące populacji. Łącząc te dwie tabele, mam nadzieję zastąpić te stare dane zaktualizowanymi liczbami .
Tak więc w mojej tabeli Lokalizacje zamierzam kliknąć kolumnę Nazwa . Następnie zamierzam kliknąć Scal zapytania .
W oknie scalania zamierzam kliknąć kolumnę Nazwa pod zakładką Lokalizacje .
Z rozwijanego menu wybieram moje dane populacji CA .
Następnie wybiorę kolumnę Miasto .
Otrzymałem powiadomienie o poziomie prywatności , więc po prostu je przejrzę.
Spójrz na dół tutaj. Mówi, że liczba wierszy w kolumnie Nazwa odpowiada liczbie wierszy w kolumnie Miasto .
Ułatwia to łączenie tych tabel razem. Oznacza to, że w CA Population Data jest wystarczająca ilość danych, które obejmują wszystkie iteracje w tabeli Locations, w której znajdują się nieprzetworzone dane .
Istnieje wiele różnych sposobów łączenia tych tabel. Opcje te można znaleźć w tym menu rozwijanym w sekcji Dołącz do rodzaju .
Zwykle używam Left Outer , ale możesz poeksperymentować z tym, co działa najlepiej.
Gdy kliknę OK, zobaczysz, że moje Zastosowane kroki pokazują, że scalanie powiodło się.
Oto nowa kolumna, która powstała w wyniku tego połączenia. Zwróć uwagę, że w wierszach jest napisane „Tabela” zamiast wyświetlać dane.
To dlatego, że cała tabela została włączona do tej starej tabeli. Zamierzam więc sprawdzić, jakie dane się w nim znajdują, klikając menu rozwijane obok nazwy kolumny.
Zdecydowanie nie potrzebuję rangi. Nie potrzebuję również nazw miast, ponieważ mam je już w moich nieprzetworzonych danych. Więc po prostu odznaczę je i zachowam dane populacji.
Teraz mam aktualne dane dotyczące populacji w mojej tabeli.
Oznacza to, że nie będę już potrzebował mojej starej kolumny Populacja, więc zamierzam ją usunąć.
Jeśli chodzi o nową kolumnę, którą dodałem, zmienię jej nazwę na Population Data .
Ponieważ nie potrzebuję, aby cała tabela, którą zaimportowałem z Internetu, była ładowana do mojego modelu za każdym razem, gdy go otwieram, wyłączę ładowanie, klikając prawym przyciskiem myszy i usuwając zaznaczenie opcji „Włącz ładowanie ” .
Muszę tylko upewnić się, że opcja „Uwzględnij w odświeżeniu raportu” pozostaje zaznaczona, aby dane, które zachowałem w mojej tabeli, nadal tam były za każdym razem, gdy odświeżam mój model.
Moje praktyczne wskazówki dotyczące korzystania z zaawansowanego edytora usługi LuckyTemplates
Jak pobierać kursy wymiany w usłudze LuckyTemplates
Prezentacja i zrozumienie anomalii w usłudze LuckyTemplates
Wniosek
Dzięki tym przekształceniom mogę uzyskać jeszcze lepszy wgląd w mój model.
Na przykład mogę teraz porównywać informacje o sprzedaży w różnych regionach na podstawie informacji o populacji. Mogę sprawdzić, jaki procent całej populacji w Kalifornii kupuje moje produkty. Mogę sprawdzić wpływ populacji w jednym mieście w porównaniu z drugim pod względem sprzedaży.
W edytorze zapytań można zrobić tak wiele. To tylko kurs dla początkujących, ale gdy przejdziesz na bardziej zaawansowane kursy, zobaczysz jeszcze więcej niesamowitych transformacji w usłudze LuckyTemplates.
Wszystkiego najlepszego
W tym samouczku omówimy pakiet dplyr, który umożliwia sortowanie, filtrowanie, dodawanie i zmianę nazw kolumn w języku R.
Odkryj różnorodne funkcje zbierania, które można wykorzystać w Power Automate. Zdobądź praktyczne informacje o funkcjach tablicowych i ich zastosowaniu.
Z tego samouczka dowiesz się, jak ocenić wydajność kodów DAX przy użyciu opcji Uruchom test porównawczy w DAX Studio.
Czym jest self w Pythonie: przykłady z życia wzięte
Dowiesz się, jak zapisywać i ładować obiekty z pliku .rds w R. Ten blog będzie również omawiał sposób importowania obiektów z R do LuckyTemplates.
Z tego samouczka języka kodowania DAX dowiesz się, jak używać funkcji GENERUJ i jak dynamicznie zmieniać tytuł miary.
W tym samouczku omówiono sposób korzystania z techniki wielowątkowych wizualizacji dynamicznych w celu tworzenia szczegółowych informacji na podstawie dynamicznych wizualizacji danych w raportach.
W tym artykule omówię kontekst filtra. Kontekst filtrowania to jeden z głównych tematów, z którym każdy użytkownik usługi LuckyTemplates powinien zapoznać się na początku.
Chcę pokazać, jak usługa online LuckyTemplates Apps może pomóc w zarządzaniu różnymi raportami i spostrzeżeniami generowanymi z różnych źródeł.
Dowiedz się, jak obliczyć zmiany marży zysku przy użyciu technik, takich jak rozgałęzianie miar i łączenie formuł języka DAX w usłudze LuckyTemplates.