Articles

Holen Sie sich eine Liste aller Spaltennamen in Pandas DataFrame

Hier sind zwei Ansätze, um eine Liste aller Spaltennamen in Pandas DataFrame zu erhalten:

Erster Ansatz:

my_list = list(df)

Zweiter Ansatz:

my_list = df.columns.values.tolist()

Später werden Sie auch sehen, welcher Ansatz am schnellsten zu verwenden.

Das Beispiel

Um mit einem einfachen Beispiel zu beginnen, erstellen wir einen Datenrahmen mit 3 Spalten:

import pandas as pddata = {'First_Name': , 'Last_Name': , 'Age': }df = pd.DataFrame(data, columns = )print (df)

Sobald Sie den obigen Code ausgeführt haben, sehen Sie den folgenden Datenrahmen mit den 3 Spalten:

Holen Sie sich eine Liste aller Spaltennamen in Pandas DataFrame

Mit list(df) um die Liste aller Spaltennamen in Pandas DataFrame zu erhalten

Sie können den ersten Ansatz verwenden, indem Sie my_list = list(df) zum Code hinzufügen:

import pandas as pddata = {'First_Name': , 'Last_Name': , 'Age': }df = pd.DataFrame(data, columns = )my_list = list(df)print (my_list)

Sie sehen jetzt die Liste mit den 3 Spaltennamen:

Liste aller Spaltennamen in Pandas DataFrame

Optional können Sie schnell überprüfen, ob Sie eine Liste erhalten haben, indem Sie print (type(my_list)) am Ende des Codes hinzufügen:

import pandas as pddata = {'First_Name': , 'Last_Name': , 'Age': }df = pd.DataFrame(data, columns = )my_list = list(df)print (my_list)print (type(my_list))

Sie können dann bestätigen, dass Sie eine Liste erhalten haben:

Holen Sie sich eine Liste aller Spaltennamen in Pandas DataFrame

Mit my_list = df.Spalten.Wertvorstellungen.tolist() um die Liste aller Spaltennamen in Pandas DataFrame

Alternativ können Sie den zweiten Ansatz anwenden, indem Sie my_list = df hinzufügen.Spalten.Wertvorstellungen.tolist() zum Code:

import pandas as pddata = {'First_Name': , 'Last_Name': , 'Age': }df = pd.DataFrame(data, columns = )my_list = df.columns.values.tolist()print (my_list)print (type(my_list))

Wie zuvor erhalten Sie jetzt die Liste mit den Spaltennamen:

Holen Sie sich eine Liste aller Spaltennamen in Pandas DataFrame

Welchen Ansatz sollten Sie wählen?

Abhängig von Ihren Anforderungen müssen Sie möglicherweise den schnelleren Ansatz verwenden.

Welcher Ansatz ist also der schnellste?

Überprüfen wir die Ausführungszeit für jede der Optionen mit dem timeit-Modul:

(1) Messen der Zeit unter dem ersten Ansatz von my_list = list(df):

from timeit import default_timerimport pandas as pddata = {'First_Name': , 'Last_Name': , 'Age': }df = pd.DataFrame(data, columns = )beginning = default_timer()my_list = list(df)ending = default_timer()print((ending - beginning)*1000)

Als ich den Code in Python ausführte, erhielt ich die folgende Ausführungszeit:

Zeit messen

Möglicherweise möchten Sie den Code einige Male ausführen, um die Ausführungszeit besser zu verstehen.

(2) Messen wir nun die Zeit unter dem zweiten Ansatz von my_list = df.Spalten.Wertvorstellungen.tolist():

from timeit import default_timerimport pandas as pddata = {'First_Name': , 'Last_Name': , 'Age': }df = pd.DataFrame(data, columns = )beginning = default_timer()my_list = df.columns.values.tolist()ending = default_timer()print((ending - beginning)*1000)

Wie Sie sehen, ist der zweite Ansatz im Vergleich zum ersten Ansatz tatsächlich schneller:

Geschwindigkeit messen

Beachten Sie, dass die Ausführungszeit je nach Pandas / Python-Version und / oder Ihrem Computer variieren kann.