Articles

Obțineți o listă cu toate numele coloanelor din cadrul de date Pandas

iată două abordări pentru a obține o listă cu toate numele coloanelor din cadrul cadrului de date Pandas:

prima abordare:

my_list = list(df)

a doua abordare:

my_list = df.columns.values.tolist()

Mai târziu veți vedea și ce abordare este cel mai rapid de utilizat.

exemplul

pentru a începe cu un exemplu simplu, să creăm un cadru de date cu 3 coloane:

import pandas as pddata = {'First_Name': , 'Last_Name': , 'Age': }df = pd.DataFrame(data, columns = )print (df)

odată ce executați codul de mai sus, veți vedea următorul cadru de date cu cele 3 coloane:

obțineți o listă cu toate numele coloanelor din cadrul de date Pandas

folosind lista(df) pentru a obține lista tuturor numelor coloanelor din cadrul cadrului de date Pandas

puteți utiliza prima abordare adăugând my_list = list(df) la codul:

import pandas as pddata = {'First_Name': , 'Last_Name': , 'Age': }df = pd.DataFrame(data, columns = )my_list = list(df)print (my_list)

veți vedea acum lista care conține cele 3 nume de coloane:

lista tuturor numelor de coloane din cadrul de date pandas

opțional, puteți verifica rapid dacă aveți o listă adăugând Print (type(my_list)) în partea de jos a codului:

import pandas as pddata = {'First_Name': , 'Last_Name': , 'Age': }df = pd.DataFrame(data, columns = )my_list = list(df)print (my_list)print (type(my_list))

veți putea apoi să confirmați că aveți o listă:

obțineți o listă cu toate numele coloanelor din cadrul de date Panda

folosind my_list = df.coloane.valori.tolist () pentru a obține lista tuturor numelor de coloane din cadrul de date Pandas

alternativ, puteți aplica a doua abordare adăugând my_list = df.coloane.valori.tolist() la codul:

import pandas as pddata = {'First_Name': , 'Last_Name': , 'Age': }df = pd.DataFrame(data, columns = )my_list = df.columns.values.tolist()print (my_list)print (type(my_list))

ca și înainte, veți obține acum lista cu numele coloanelor:

obțineți o listă cu toate numele coloanelor din cadrul de date Pandas

ce abordare ar trebui să alegeți?

în funcție de nevoile dvs., poate fi necesar să utilizați abordarea mai rapidă.

deci, care abordare este cea mai rapidă?

să verificăm timpul de execuție pentru fiecare dintre opțiuni folosind modulul timeit:

(1) Măsurarea timpului sub prima abordare a my_list = list(DF):

from timeit import default_timerimport pandas as pddata = {'First_Name': , 'Last_Name': , 'Age': }df = pd.DataFrame(data, columns = )beginning = default_timer()my_list = list(df)ending = default_timer()print((ending - beginning)*1000)

când am rulat codul în Python, am obținut următorul timp de execuție:

măsurați timpul

ați putea dori să rulați codul de câteva ori pentru a obține o mai bună înțelegere a timpului de execuție.

(2) acum să măsurăm timpul sub a doua abordare a my_list = df.coloane.valori.tolist ():

from timeit import default_timerimport pandas as pddata = {'First_Name': , 'Last_Name': , 'Age': }df = pd.DataFrame(data, columns = )beginning = default_timer()my_list = df.columns.values.tolist()ending = default_timer()print((ending - beginning)*1000)

după cum puteți vedea, a doua abordare este de fapt mai rapidă în comparație cu prima abordare:

măsurați viteza

rețineți că timpul de execuție poate varia în funcție de versiunea Panda/Python și/sau de mașina dvs.