Articles

Haal een lijst van alle kolomnamen in Panda ’s DataFrame

Hier zijn twee benaderingen om een lijst te krijgen van alle kolomnamen in Panda’ s DataFrame:

eerste benadering:

my_list = list(df)

tweede benadering:

my_list = df.columns.values.tolist()

Later zult u ook zien welke benadering het snelst te gebruiken is.

het voorbeeld

om te beginnen met een eenvoudig voorbeeld, laten we een DataFrame maken met 3 kolommen:

import pandas as pddata = {'First_Name': , 'Last_Name': , 'Age': }df = pd.DataFrame(data, columns = )print (df)

zodra u de bovenstaande code uitvoert, ziet u het volgende DataFrame met de 3 kolommen:

Voor een Lijst van alle kolomnamen in Panda 's DataFrame

met Behulp van de lijst(df) om de Lijst van alle kolomnamen in Panda’ s DataFrame

U kunt de eerste benadering door het toevoegen van my_list = lijst(df) aan de code:

import pandas as pddata = {'First_Name': , 'Last_Name': , 'Age': }df = pd.DataFrame(data, columns = )my_list = list(df)print (my_list)

U ziet nu de Lijst met de 3 kolom namen:

Lijst van alle kolomnamen in Panda ' s DataFrame

u kunt snel controleren of je kreeg een lijst door het toevoegen print (type(my_list)) naar de onderkant van de code:

import pandas as pddata = {'First_Name': , 'Last_Name': , 'Age': }df = pd.DataFrame(data, columns = )my_list = list(df)print (my_list)print (type(my_list))

u kunt dan bevestigen dat u een lijst hebt:

haal een lijst op van alle kolomnamen in Panda ' s DataFrame

met behulp van mijn_list = df.kolom.waarde.tolist() om de lijst van alle kolomnamen in Panda ‘ s DataFrame

te krijgen, kunt u ook de tweede benadering toepassen door my_list = df toe te voegen.kolom.waarde.tolist() naar de code:

import pandas as pddata = {'First_Name': , 'Last_Name': , 'Age': }df = pd.DataFrame(data, columns = )my_list = df.columns.values.tolist()print (my_list)print (type(my_list))

zoals eerder, krijg je nu de lijst met de kolomnamen:

haal een lijst op van alle kolomnamen in Panda ' s DataFrame

welke aanpak moet u kiezen?

afhankelijk van uw behoeften, kunt u de snellere aanpak gebruiken.

dus welke aanpak is de snelste?

laten we de uitvoeringstijd voor elk van de opties controleren met behulp van de timeit-module:

(1) De tijd meten onder de eerste benadering van my_list = list (df):

from timeit import default_timerimport pandas as pddata = {'First_Name': , 'Last_Name': , 'Age': }df = pd.DataFrame(data, columns = )beginning = default_timer()my_list = list(df)ending = default_timer()print((ending - beginning)*1000)

toen ik de code in Python uitvoerde, kreeg ik de volgende uitvoertijd:

meettijd

u wilt de code misschien een paar keer uitvoeren om een beter beeld te krijgen van de uitvoertijd.

(2) Laten we nu de tijd meten onder de tweede benadering van my_list = df.kolom.waarde.tolist ():

from timeit import default_timerimport pandas as pddata = {'First_Name': , 'Last_Name': , 'Age': }df = pd.DataFrame(data, columns = )beginning = default_timer()my_list = df.columns.values.tolist()ending = default_timer()print((ending - beginning)*1000)

zoals u kunt zien, is de tweede benadering eigenlijk sneller vergeleken met de eerste benadering:

meet snelheid

merk op dat de uitvoeringstijd kan variëren afhankelijk van uw panda ‘ s/Python versie en/of uw machine.