Articles

Uzyskaj listę wszystkich nazw kolumn w ramce danych Pandy

oto dwa podejścia, aby uzyskać listę wszystkich nazw kolumn w ramce danych Pandy:

pierwsze podejście:

my_list = list(df)

drugie podejście:

my_list = df.columns.values.tolist()

później zobaczysz również, które podejście jest najszybszy w użyciu.

przykład

aby rozpocząć od prostego przykładu, stwórzmy ramkę danych z 3 kolumnami:

import pandas as pddata = {'First_Name': , 'Last_Name': , 'Age': }df = pd.DataFrame(data, columns = )print (df)

Po uruchomieniu powyższego kodu zobaczysz następującą ramkę danych z 3 kolumnami:

Pobierz listę wszystkich nazw kolumn w ramce danych Pandy

używając list(DF) aby uzyskać listę wszystkich nazw kolumn w ramce danych Pandy

możesz użyć pierwszego podejścia, dodając my_list = list(DF) do kodu:

import pandas as pddata = {'First_Name': , 'Last_Name': , 'Age': }df = pd.DataFrame(data, columns = )my_list = list(df)print (my_list)

zobaczysz listę zawierającą 3 nazwy kolumn:

lista wszystkich nazw kolumn w ramce danych pandy

opcjonalnie możesz szybko sprawdzić, czy masz listę, dodając Print (type(my_list)) na dole kodu:

import pandas as pddata = {'First_Name': , 'Last_Name': , 'Age': }df = pd.DataFrame(data, columns = )my_list = list(df)print (my_list)print (type(my_list))

będziesz mógł potwierdzić, że masz listę:

Pobierz listę wszystkich nazw kolumn w ramce danych Pandy

używając my_list = df.kolumny.wartości.tolist () aby uzyskać listę wszystkich nazw kolumn w ramce danych Pandy

Alternatywnie, możesz zastosować drugie podejście, dodając my_list = df.kolumny.wartości.tolist () do kodu:

import pandas as pddata = {'First_Name': , 'Last_Name': , 'Age': }df = pd.DataFrame(data, columns = )my_list = df.columns.values.tolist()print (my_list)print (type(my_list))

tak jak poprzednio, otrzymasz listę z nazwami kolumn:

Pobierz listę wszystkich nazw kolumn w ramce danych Pandy

które podejście wybrać?

w zależności od potrzeb, może być konieczne zastosowanie szybszego podejścia.

więc które podejście jest najszybsze?

sprawdźmy czas wykonania każdej z opcji za pomocą modułu timeit:

(1) Pomiar czasu przy pierwszym podejściu my_list = list(DF):

from timeit import default_timerimport pandas as pddata = {'First_Name': , 'Last_Name': , 'Age': }df = pd.DataFrame(data, columns = )beginning = default_timer()my_list = list(df)ending = default_timer()print((ending - beginning)*1000)

Kiedy uruchomiłem kod w Pythonie, otrzymałem następujący czas wykonania:

mierz czas

możesz chcieć uruchomić kod kilka razy, aby uzyskać lepsze wyczucie czasu wykonania.

(2) Teraz zmierzmy czas pod drugim podejściem my_list = df.kolumny.wartości.tolist():

from timeit import default_timerimport pandas as pddata = {'First_Name': , 'Last_Name': , 'Age': }df = pd.DataFrame(data, columns = )beginning = default_timer()my_list = df.columns.values.tolist()ending = default_timer()print((ending - beginning)*1000)

jak widzisz, drugie podejście jest szybsze w porównaniu z pierwszym podejściem:

zmierz prędkość

zauważ, że czas wykonania może się różnić w zależności od wersji Pandy/Pythona i/lub twojej maszyny.