Abbildung 4. PCA scree plot
Die gute Nachricht ist, wenn die ersten zwei oder drei PCs die meisten Informationen erfasst haben, können wir den Rest ignorieren, ohne etwas Wichtiges zu verlieren. Ein Gerölldiagramm zeigt, wie viel Variation jeder PC aus den Daten erfasst. Die y-Achse sind Eigenwerte, die im Wesentlichen für den Variationsgrad stehen. Verwenden Sie ein Gerölldiagramm, um die Hauptkomponenten auszuwählen, die beibehalten werden sollen. Eine ideale Kurve sollte steil sein, sich dann an einem „Ellbogen“ biegen — dies ist Ihr Schnittpunkt – und danach abflachen. In Abbildung 4 reichen nur PC 1,2 und 3 aus, um die Daten zu beschreiben.
Um mit einer nicht so idealen Geröll-Plotkurve umzugehen, gibt es ein paar Möglichkeiten:
- Kaiser-Regel: Wählen Sie PCs mit Eigenwerten von mindestens 1.
- Anteil des Varianzdiagramms: Die ausgewählten PCs sollten in der Lage sein, mindestens 80% der Varianz zu beschreiben.
Wenn Sie am Ende zu viele Hauptkomponenten (mehr als 3) haben, ist PCA möglicherweise nicht der beste Weg, um Ihre Daten zu visualisieren. Erwägen Sie stattdessen andere Dimensionsreduktionstechniken wie t-SNE und MDS.
Zusammenfassend: Ein PCA-Biplot zeigt sowohl PC-Scores von Samples (Dots) als auch Loadings von Variablen (Vektoren). Je weiter diese Vektoren von einem PC-Ursprung entfernt sind, desto mehr Einfluss haben sie auf diesen PC. Ladendiagramme weisen auch darauf hin, wie Variablen miteinander korrelieren: Ein kleiner Winkel impliziert eine positive Korrelation, ein großer Winkel deutet auf eine negative Korrelation hin, und ein 90 ° -Winkel zeigt keine Korrelation zwischen zwei Merkmalen an. Ein Gerölldiagramm zeigt an, wie viel Variation jede Hauptkomponente aus den Daten erfasst. Wenn die ersten zwei oder drei PCs ausreichen, um das Wesentliche der Daten zu beschreiben, ist das Gerölldiagramm eine steile Kurve, die sich schnell biegt und abflacht.
Suchen Sie nach einer Möglichkeit, PCA-Biplots und Geröll-Plots einfach zu erstellen? Probieren Sie BioVinci aus, eine Drag-and-Drop-Software, mit der PCA ausgeführt und alles mit nur wenigen Klicks wie niemandes Geschäft dargestellt werden kann.