Obțineți o listă cu toate numele coloanelor din cadrul de date Pandas
iată două abordări pentru a obține o listă cu toate numele coloanelor din cadrul cadrului de date Pandas:
prima abordare:
my_list = list(df)
a doua abordare:
my_list = df.columns.values.tolist()
Mai târziu veți vedea și ce abordare este cel mai rapid de utilizat.
exemplul
pentru a începe cu un exemplu simplu, să creăm un cadru de date cu 3 coloane:
import pandas as pddata = {'First_Name': , 'Last_Name': , 'Age': }df = pd.DataFrame(data, columns = )print (df)
odată ce executați codul de mai sus, veți vedea următorul cadru de date cu cele 3 coloane:
folosind lista(df) pentru a obține lista tuturor numelor coloanelor din cadrul cadrului de date Pandas
puteți utiliza prima abordare adăugând my_list = list(df) la codul:
import pandas as pddata = {'First_Name': , 'Last_Name': , 'Age': }df = pd.DataFrame(data, columns = )my_list = list(df)print (my_list)
veți vedea acum lista care conține cele 3 nume de coloane:
opțional, puteți verifica rapid dacă aveți o listă adăugând Print (type(my_list)) în partea de jos a codului:
import pandas as pddata = {'First_Name': , 'Last_Name': , 'Age': }df = pd.DataFrame(data, columns = )my_list = list(df)print (my_list)print (type(my_list))
veți putea apoi să confirmați că aveți o listă:
folosind my_list = df.coloane.valori.tolist () pentru a obține lista tuturor numelor de coloane din cadrul de date Pandas
alternativ, puteți aplica a doua abordare adăugând my_list = df.coloane.valori.tolist() la codul:
import pandas as pddata = {'First_Name': , 'Last_Name': , 'Age': }df = pd.DataFrame(data, columns = )my_list = df.columns.values.tolist()print (my_list)print (type(my_list))
ca și înainte, veți obține acum lista cu numele coloanelor:
ce abordare ar trebui să alegeți?
în funcție de nevoile dvs., poate fi necesar să utilizați abordarea mai rapidă.
deci, care abordare este cea mai rapidă?
să verificăm timpul de execuție pentru fiecare dintre opțiuni folosind modulul timeit:
(1) Măsurarea timpului sub prima abordare a my_list = list(DF):
from timeit import default_timerimport pandas as pddata = {'First_Name': , 'Last_Name': , 'Age': }df = pd.DataFrame(data, columns = )beginning = default_timer()my_list = list(df)ending = default_timer()print((ending - beginning)*1000)
când am rulat codul în Python, am obținut următorul timp de execuție:
ați putea dori să rulați codul de câteva ori pentru a obține o mai bună înțelegere a timpului de execuție.
(2) acum să măsurăm timpul sub a doua abordare a my_list = df.coloane.valori.tolist ():
from timeit import default_timerimport pandas as pddata = {'First_Name': , 'Last_Name': , 'Age': }df = pd.DataFrame(data, columns = )beginning = default_timer()my_list = df.columns.values.tolist()ending = default_timer()print((ending - beginning)*1000)
după cum puteți vedea, a doua abordare este de fapt mai rapidă în comparație cu prima abordare:
rețineți că timpul de execuție poate varia în funcție de versiunea Panda/Python și/sau de mașina dvs.