Získat Seznam všech Názvů Sloupců v Pandy Datovém
Zde jsou dva přístupy, jak získat seznam všech názvů sloupců v Pandy Datovém:
První přístup:
my_list = list(df)
Druhý přístup:
my_list = df.columns.values.tolist()
Později uvidíte také, jaký přístup je nejrychlejší použití.
Příklad:
začít s jednoduchým příkladem, pojďme vytvořit Datovém s 3 sloupce:
import pandas as pddata = {'First_Name': , 'Last_Name': , 'Age': }df = pd.DataFrame(data, columns = )print (df)
po spuštění výše uvedený kód, uvidíte v následujícím Datovém s 3 sloupce:
Použití seznamu(df), aby se Seznam všech Názvů Sloupců v Pandy Datovém
můžete použít první přístup přidáním my_list = seznam(df) kód:
import pandas as pddata = {'First_Name': , 'Last_Name': , 'Age': }df = pd.DataFrame(data, columns = )my_list = list(df)print (my_list)
Budete nyní vidět Seznam, který obsahuje 3 sloupce názvy:
Volitelně můžete rychle ověřit, že máte seznam přidáním print (type(my_list)) na dno kód:
import pandas as pddata = {'First_Name': , 'Last_Name': , 'Age': }df = pd.DataFrame(data, columns = )my_list = list(df)print (my_list)print (type(my_list))
Budete pak moci potvrdit, že máš seznam:
Použití my_list = df.sloupec.hodnota.tolist (), aby se Seznam všech Názvů Sloupců v Pandy Datovém
Případně můžete použít druhý přístup přidáním my_list = df.sloupec.hodnota.tolist () do kódu:
import pandas as pddata = {'First_Name': , 'Last_Name': , 'Age': }df = pd.DataFrame(data, columns = )my_list = df.columns.values.tolist()print (my_list)print (type(my_list))
stejně jako dříve získáte seznam s názvy sloupců:
, Který přístup zvolit?
V závislosti na vašich potřebách může být nutné použít rychlejší přístup.
který přístup je tedy nejrychlejší?
Pojďme se podívat, čas spuštění pro každou z možností pomocí timeit modulu:
(1) Měření času v rámci prvního přístupu my_list = seznam(df):
from timeit import default_timerimport pandas as pddata = {'First_Name': , 'Last_Name': , 'Age': }df = pd.DataFrame(data, columns = )beginning = default_timer()my_list = list(df)ending = default_timer()print((ending - beginning)*1000)
Když jsem běžel kód v Pythonu, jsem dostal následující doba realizace:
možná budete chtít kód spustit několikrát, abyste získali lepší představu o době spuštění.
(2) Nyní změříme čas pod druhým přístupem my_list = df.sloupec.hodnota.tolist():
from timeit import default_timerimport pandas as pddata = {'First_Name': , 'Last_Name': , 'Age': }df = pd.DataFrame(data, columns = )beginning = default_timer()my_list = df.columns.values.tolist()ending = default_timer()print((ending - beginning)*1000)
Jak můžete vidět, druhý přístup je skutečně rychlejší ve srovnání s první přístup:
Všimněte si, že doba realizace se může lišit v závislosti na vaší Pandy/Python verze a/nebo váš počítač.