Articles

Hanki luettelo kaikista sarakkeiden nimistä pandas DataFrame

tässä on kaksi tapaa saada luettelo kaikista sarakkeiden nimistä pandas DataFrame:

First approach:

my_list = list(df)

Second approach:

my_list = df.columns.values.tolist()

myöhemmin näet myös, kumpi lähestymistapa on nopein käyttää.

esimerkki

aloitetaan yksinkertaisella esimerkillä: luodaan DataFrame, jossa on 3 saraketta:

import pandas as pddata = {'First_Name': , 'Last_Name': , 'Age': }df = pd.DataFrame(data, columns = )print (df)

kun Yllä oleva koodi suoritetaan, näet seuraavat DataFrame, jossa on 3 saraketta:

Hanki luettelo kaikista sarakkeiden nimistä Pandas DataFrame

käyttämällä list(df) saadaksesi luettelon kaikista sarakkeiden nimistä Pandas DataFrame

voit käyttää ensimmäistä lähestymistapaa lisäämällä koodiin my_list = list(DF):

import pandas as pddata = {'First_Name': , 'Last_Name': , 'Age': }df = pd.DataFrame(data, columns = )my_list = list(df)print (my_list)

näet nyt listan, joka sisältää 3 sarakkeen nimet:

luettelo kaikista sarakkeiden nimistä pandas dataframe

valinnaisesti voit nopeasti varmistaa, että sait listan lisäämällä koodin alaosaan Print (type(my_list)) :

import pandas as pddata = {'First_Name': , 'Last_Name': , 'Age': }df = pd.DataFrame(data, columns = )my_list = list(df)print (my_list)print (type(my_list))

voit sitten vahvistaa, että sait listan:

Hanki luettelo kaikista sarakkeiden nimistä Pandatiedoissa

käyttäen My_list = df.sarake.arvo.tolist () saadaksesi luettelon kaikista sarakkeiden nimistä pandas DataFrame

Vaihtoehtoisesti voit käyttää toista lähestymistapaa lisäämällä my_list = df.sarake.arvo.tolist() koodiin:

import pandas as pddata = {'First_Name': , 'Last_Name': , 'Age': }df = pd.DataFrame(data, columns = )my_list = df.columns.values.tolist()print (my_list)print (type(my_list))

kuten ennen, saat nyt listan sarakkeen nimillä:

Hanki lista kaikista sarakkeiden nimistä Pandatiedoissa

kumman lähestymistavan valitset?

tarpeistasi riippuen saatat joutua käyttämään nopeampaa lähestymistapaa.

mikä lähestymistapa on siis nopein?

tarkistetaan kunkin vaihtoehdon suoritusaika timeit-moduulin avulla:

(1) mittaamalla aikaa my_list = list(DF):

from timeit import default_timerimport pandas as pddata = {'First_Name': , 'Last_Name': , 'Age': }df = pd.DataFrame(data, columns = )beginning = default_timer()my_list = list(df)ending = default_timer()print((ending - beginning)*1000)

kun ajoin koodin Pythonissa, sain seuraavan suoritusajan:

mittaa aika

voit halutessasi ajaa koodin muutaman kerran saadaksesi paremman käsityksen suoritusajasta.

(2) nyt mitataan aika my_list = df: n toisen lähestymistavan mukaisesti.sarake.arvo.tolist ():

from timeit import default_timerimport pandas as pddata = {'First_Name': , 'Last_Name': , 'Age': }df = pd.DataFrame(data, columns = )beginning = default_timer()my_list = df.columns.values.tolist()ending = default_timer()print((ending - beginning)*1000)

kuten näette, toinen lähestyminen on itse asiassa nopeampi ensimmäiseen lähestymiseen verrattuna:

Mittaa nopeus

huomaa, että suoritusaika voi vaihdella Pandas/Python-versiostasi ja/tai koneestasi riippuen.