Hanki luettelo kaikista sarakkeiden nimistä pandas DataFrame
tässä on kaksi tapaa saada luettelo kaikista sarakkeiden nimistä pandas DataFrame:
First approach:
my_list = list(df)
Second approach:
my_list = df.columns.values.tolist()
myöhemmin näet myös, kumpi lähestymistapa on nopein käyttää.
esimerkki
aloitetaan yksinkertaisella esimerkillä: luodaan DataFrame, jossa on 3 saraketta:
import pandas as pddata = {'First_Name': , 'Last_Name': , 'Age': }df = pd.DataFrame(data, columns = )print (df)
kun Yllä oleva koodi suoritetaan, näet seuraavat DataFrame, jossa on 3 saraketta:
käyttämällä list(df) saadaksesi luettelon kaikista sarakkeiden nimistä Pandas DataFrame
voit käyttää ensimmäistä lähestymistapaa lisäämällä koodiin my_list = list(DF):
import pandas as pddata = {'First_Name': , 'Last_Name': , 'Age': }df = pd.DataFrame(data, columns = )my_list = list(df)print (my_list)
näet nyt listan, joka sisältää 3 sarakkeen nimet:
valinnaisesti voit nopeasti varmistaa, että sait listan lisäämällä koodin alaosaan Print (type(my_list)) :
import pandas as pddata = {'First_Name': , 'Last_Name': , 'Age': }df = pd.DataFrame(data, columns = )my_list = list(df)print (my_list)print (type(my_list))
voit sitten vahvistaa, että sait listan:
käyttäen My_list = df.sarake.arvo.tolist () saadaksesi luettelon kaikista sarakkeiden nimistä pandas DataFrame
Vaihtoehtoisesti voit käyttää toista lähestymistapaa lisäämällä my_list = df.sarake.arvo.tolist() koodiin:
import pandas as pddata = {'First_Name': , 'Last_Name': , 'Age': }df = pd.DataFrame(data, columns = )my_list = df.columns.values.tolist()print (my_list)print (type(my_list))
kuten ennen, saat nyt listan sarakkeen nimillä:
kumman lähestymistavan valitset?
tarpeistasi riippuen saatat joutua käyttämään nopeampaa lähestymistapaa.
mikä lähestymistapa on siis nopein?
tarkistetaan kunkin vaihtoehdon suoritusaika timeit-moduulin avulla:
(1) mittaamalla aikaa my_list = list(DF):
from timeit import default_timerimport pandas as pddata = {'First_Name': , 'Last_Name': , 'Age': }df = pd.DataFrame(data, columns = )beginning = default_timer()my_list = list(df)ending = default_timer()print((ending - beginning)*1000)
kun ajoin koodin Pythonissa, sain seuraavan suoritusajan:
voit halutessasi ajaa koodin muutaman kerran saadaksesi paremman käsityksen suoritusajasta.
(2) nyt mitataan aika my_list = df: n toisen lähestymistavan mukaisesti.sarake.arvo.tolist ():
from timeit import default_timerimport pandas as pddata = {'First_Name': , 'Last_Name': , 'Age': }df = pd.DataFrame(data, columns = )beginning = default_timer()my_list = df.columns.values.tolist()ending = default_timer()print((ending - beginning)*1000)
kuten näette, toinen lähestyminen on itse asiassa nopeampi ensimmäiseen lähestymiseen verrattuna:
huomaa, että suoritusaika voi vaihdella Pandas/Python-versiostasi ja/tai koneestasi riippuen.