Uzyskaj listę wszystkich nazw kolumn w ramce danych Pandy
oto dwa podejścia, aby uzyskać listę wszystkich nazw kolumn w ramce danych Pandy:
pierwsze podejście:
my_list = list(df)
drugie podejście:
my_list = df.columns.values.tolist()
później zobaczysz również, które podejście jest najszybszy w użyciu.
przykład
aby rozpocząć od prostego przykładu, stwórzmy ramkę danych z 3 kolumnami:
import pandas as pddata = {'First_Name': , 'Last_Name': , 'Age': }df = pd.DataFrame(data, columns = )print (df)
Po uruchomieniu powyższego kodu zobaczysz następującą ramkę danych z 3 kolumnami:
używając list(DF) aby uzyskać listę wszystkich nazw kolumn w ramce danych Pandy
możesz użyć pierwszego podejścia, dodając my_list = list(DF) do kodu:
import pandas as pddata = {'First_Name': , 'Last_Name': , 'Age': }df = pd.DataFrame(data, columns = )my_list = list(df)print (my_list)
zobaczysz listę zawierającą 3 nazwy kolumn:
opcjonalnie możesz szybko sprawdzić, czy masz listę, dodając Print (type(my_list)) na dole kodu:
import pandas as pddata = {'First_Name': , 'Last_Name': , 'Age': }df = pd.DataFrame(data, columns = )my_list = list(df)print (my_list)print (type(my_list))
będziesz mógł potwierdzić, że masz listę:
używając my_list = df.kolumny.wartości.tolist () aby uzyskać listę wszystkich nazw kolumn w ramce danych Pandy
Alternatywnie, możesz zastosować drugie podejście, dodając my_list = df.kolumny.wartości.tolist () do kodu:
import pandas as pddata = {'First_Name': , 'Last_Name': , 'Age': }df = pd.DataFrame(data, columns = )my_list = df.columns.values.tolist()print (my_list)print (type(my_list))
tak jak poprzednio, otrzymasz listę z nazwami kolumn:
które podejście wybrać?
w zależności od potrzeb, może być konieczne zastosowanie szybszego podejścia.
więc które podejście jest najszybsze?
sprawdźmy czas wykonania każdej z opcji za pomocą modułu timeit:
(1) Pomiar czasu przy pierwszym podejściu my_list = list(DF):
from timeit import default_timerimport pandas as pddata = {'First_Name': , 'Last_Name': , 'Age': }df = pd.DataFrame(data, columns = )beginning = default_timer()my_list = list(df)ending = default_timer()print((ending - beginning)*1000)
Kiedy uruchomiłem kod w Pythonie, otrzymałem następujący czas wykonania:
możesz chcieć uruchomić kod kilka razy, aby uzyskać lepsze wyczucie czasu wykonania.
(2) Teraz zmierzmy czas pod drugim podejściem my_list = df.kolumny.wartości.tolist():
from timeit import default_timerimport pandas as pddata = {'First_Name': , 'Last_Name': , 'Age': }df = pd.DataFrame(data, columns = )beginning = default_timer()my_list = df.columns.values.tolist()ending = default_timer()print((ending - beginning)*1000)
jak widzisz, drugie podejście jest szybsze w porównaniu z pierwszym podejściem:
zauważ, że czas wykonania może się różnić w zależności od wersji Pandy/Pythona i/lub twojej maszyny.