Holen Sie sich eine Liste aller Spaltennamen in Pandas DataFrame
Hier sind zwei Ansätze, um eine Liste aller Spaltennamen in Pandas DataFrame zu erhalten:
Erster Ansatz:
my_list = list(df)
Zweiter Ansatz:
my_list = df.columns.values.tolist()
Später werden Sie auch sehen, welcher Ansatz am schnellsten zu verwenden.
Das Beispiel
Um mit einem einfachen Beispiel zu beginnen, erstellen wir einen Datenrahmen mit 3 Spalten:
import pandas as pddata = {'First_Name': , 'Last_Name': , 'Age': }df = pd.DataFrame(data, columns = )print (df)
Sobald Sie den obigen Code ausgeführt haben, sehen Sie den folgenden Datenrahmen mit den 3 Spalten:
Mit list(df) um die Liste aller Spaltennamen in Pandas DataFrame zu erhalten
Sie können den ersten Ansatz verwenden, indem Sie my_list = list(df) zum Code hinzufügen:
import pandas as pddata = {'First_Name': , 'Last_Name': , 'Age': }df = pd.DataFrame(data, columns = )my_list = list(df)print (my_list)
Sie sehen jetzt die Liste mit den 3 Spaltennamen:
Optional können Sie schnell überprüfen, ob Sie eine Liste erhalten haben, indem Sie print (type(my_list)) am Ende des Codes hinzufügen:
import pandas as pddata = {'First_Name': , 'Last_Name': , 'Age': }df = pd.DataFrame(data, columns = )my_list = list(df)print (my_list)print (type(my_list))
Sie können dann bestätigen, dass Sie eine Liste erhalten haben:
Mit my_list = df.Spalten.Wertvorstellungen.tolist() um die Liste aller Spaltennamen in Pandas DataFrame
Alternativ können Sie den zweiten Ansatz anwenden, indem Sie my_list = df hinzufügen.Spalten.Wertvorstellungen.tolist() zum Code:
import pandas as pddata = {'First_Name': , 'Last_Name': , 'Age': }df = pd.DataFrame(data, columns = )my_list = df.columns.values.tolist()print (my_list)print (type(my_list))
Wie zuvor erhalten Sie jetzt die Liste mit den Spaltennamen:
Welchen Ansatz sollten Sie wählen?
Abhängig von Ihren Anforderungen müssen Sie möglicherweise den schnelleren Ansatz verwenden.
Welcher Ansatz ist also der schnellste?
Überprüfen wir die Ausführungszeit für jede der Optionen mit dem timeit-Modul:
(1) Messen der Zeit unter dem ersten Ansatz von my_list = list(df):
from timeit import default_timerimport pandas as pddata = {'First_Name': , 'Last_Name': , 'Age': }df = pd.DataFrame(data, columns = )beginning = default_timer()my_list = list(df)ending = default_timer()print((ending - beginning)*1000)
Als ich den Code in Python ausführte, erhielt ich die folgende Ausführungszeit:
Möglicherweise möchten Sie den Code einige Male ausführen, um die Ausführungszeit besser zu verstehen.
(2) Messen wir nun die Zeit unter dem zweiten Ansatz von my_list = df.Spalten.Wertvorstellungen.tolist():
from timeit import default_timerimport pandas as pddata = {'First_Name': , 'Last_Name': , 'Age': }df = pd.DataFrame(data, columns = )beginning = default_timer()my_list = df.columns.values.tolist()ending = default_timer()print((ending - beginning)*1000)
Wie Sie sehen, ist der zweite Ansatz im Vergleich zum ersten Ansatz tatsächlich schneller:
Beachten Sie, dass die Ausführungszeit je nach Pandas / Python-Version und / oder Ihrem Computer variieren kann.