Haal een lijst van alle kolomnamen in Panda ’s DataFrame
Hier zijn twee benaderingen om een lijst te krijgen van alle kolomnamen in Panda’ s DataFrame:
eerste benadering:
my_list = list(df)
tweede benadering:
my_list = df.columns.values.tolist()
Later zult u ook zien welke benadering het snelst te gebruiken is.
het voorbeeld
om te beginnen met een eenvoudig voorbeeld, laten we een DataFrame maken met 3 kolommen:
import pandas as pddata = {'First_Name': , 'Last_Name': , 'Age': }df = pd.DataFrame(data, columns = )print (df)
zodra u de bovenstaande code uitvoert, ziet u het volgende DataFrame met de 3 kolommen:
met Behulp van de lijst(df) om de Lijst van alle kolomnamen in Panda’ s DataFrame
U kunt de eerste benadering door het toevoegen van my_list = lijst(df) aan de code:
import pandas as pddata = {'First_Name': , 'Last_Name': , 'Age': }df = pd.DataFrame(data, columns = )my_list = list(df)print (my_list)
U ziet nu de Lijst met de 3 kolom namen:
u kunt snel controleren of je kreeg een lijst door het toevoegen print (type(my_list)) naar de onderkant van de code:
import pandas as pddata = {'First_Name': , 'Last_Name': , 'Age': }df = pd.DataFrame(data, columns = )my_list = list(df)print (my_list)print (type(my_list))
u kunt dan bevestigen dat u een lijst hebt:
met behulp van mijn_list = df.kolom.waarde.tolist() om de lijst van alle kolomnamen in Panda ‘ s DataFrame
te krijgen, kunt u ook de tweede benadering toepassen door my_list = df toe te voegen.kolom.waarde.tolist() naar de code:
import pandas as pddata = {'First_Name': , 'Last_Name': , 'Age': }df = pd.DataFrame(data, columns = )my_list = df.columns.values.tolist()print (my_list)print (type(my_list))
zoals eerder, krijg je nu de lijst met de kolomnamen:
welke aanpak moet u kiezen?
afhankelijk van uw behoeften, kunt u de snellere aanpak gebruiken.
dus welke aanpak is de snelste?
laten we de uitvoeringstijd voor elk van de opties controleren met behulp van de timeit-module:
(1) De tijd meten onder de eerste benadering van my_list = list (df):
from timeit import default_timerimport pandas as pddata = {'First_Name': , 'Last_Name': , 'Age': }df = pd.DataFrame(data, columns = )beginning = default_timer()my_list = list(df)ending = default_timer()print((ending - beginning)*1000)
toen ik de code in Python uitvoerde, kreeg ik de volgende uitvoertijd:
u wilt de code misschien een paar keer uitvoeren om een beter beeld te krijgen van de uitvoertijd.
(2) Laten we nu de tijd meten onder de tweede benadering van my_list = df.kolom.waarde.tolist ():
from timeit import default_timerimport pandas as pddata = {'First_Name': , 'Last_Name': , 'Age': }df = pd.DataFrame(data, columns = )beginning = default_timer()my_list = df.columns.values.tolist()ending = default_timer()print((ending - beginning)*1000)
zoals u kunt zien, is de tweede benadering eigenlijk sneller vergeleken met de eerste benadering:
merk op dat de uitvoeringstijd kan variëren afhankelijk van uw panda ‘ s/Python versie en/of uw machine.