DataLab ist ein kompaktes Statistikprogramm zur explorativen Datenanalyse. Weitere Informationen finden Sie auf den DataLab Webseiten ....



PCR

Befehl: Mathematik -> Multiple Regression -> Hauptkomponentenregression...

Der Befehl Mathematik/Multiple Regression/Hauptkomponentenregression... ermöglicht die Regression einer Variablen gegen die Hauptkomponentenscores von ausgewählten unabhängigen Variablen. Nach dem Anklicken von Mathematik/Hauptkomponentenregression... muss der Benutzer die Skalierungsart sowie die unabhängigen Variablen und die abhängige Variable auswählen.

Um die Hauptkomponentenanalyse der unabhängigen Variablen und die Regression der Hauptkomponentenscores gegen die abhängige Variable durchzuführen müssen Sie den Knopf "Berechnen" anklicken. Standardmäßig werden alle Hauptkomponenten mit einem Eigenwert größer als eins zur Regression herangezogen. Sie können dies ändern, in dem Sie entweder die entsprechende Zahl an Hauptkomponenten in der Box "Zahl der HK" auswählen, oder in dem Sie in den Scree Plot (Eigenwertdiagramm) auf dem Reiter "Zusammenfassung" klicken (die Zahl der ausgewählten Komponenten wird durch die rote vertikale Linie angezeigt, alle Komponenten links von der Linie werden für den folgenden Regressionsschritt verwendet).

Die Hauptkomponentenanalyse der unabhängigen Variablen kann aufgrund unterschiedlich skalierter Variablen durchgeführt werden:
keine Skalierung Berechnung einer neuen PCA aus den unskalierten Daten (die PCA basiert auf der Streumatrix)
Mittelwert zentrieren Berechnung einer neuen PCA mit mittelwertzentrierten Variablen (die PCA basiert auf der Kovarianzmatrix)
Standardisierung Berechnung einer neuen PCA unter Verwendung von standardisierten Variablen (die PCA basiert auf der Korrelationsmatrix)

 

Die Ergebnisse der Hauptkomponentenregression werden auf fünf Seiten mit folgenden Reitern dargestellt:
Zusammenfassung Die Zusammenfassung zeigt die sortierte Liste der Hauptkomponenten mit den Prozentanteilen der Varianz und das Eigenwertdiagramm ("Scree Plot"). Das Eigenwertdiagramm stellt den Logarithmus der Eigenwerte gegen die Nummer der Hauptkomponenten dar. Eigenwerte, die größer als 1.0 sind (für standardisierte Varíablen) bzw. alle Eigenwerte bis zu einer kumulierten Summe von max. 98% (für nicht-standardisierte Variablen) werden durch rote Kreuze markiert. Das Eigenwertdiagramm kann dazu benützt werden, die Zahl der für die Regression verwendeten Hauptkomponenten zu bestimmen. Wenn man in das Diagramm klickt wird die Zahl der Komponenten entsprechend eingestellt (die ausgewählten Hauptkomponenten werden durch eine rote Linie und einen gelb unterlegten Bereich links davon angezeigt).
Wirkliche vs. geschätzte Werte Diese Seite stellt die geschätzten Werte der Zielvariable gegen die tatsächlichen Werte dar. Eine 45-Grad-Gerade zeigt den optimalen Fit (je näher die Punkte bei dieser Geraden liegen, desto besser ist die Anpassung der Regression). Wenn man die Maus über die Punkte bewegt, wird der jeweils nächste Datenpunkt durch ein umschriebenes Quadrat markiert; die entsprechenden Koordinaten und der Objektname (Zeilenname in der Datenmatrix) werden rechts daneben angezeigt.
Verteilung der Residuen Die Verteilung der Residuen wird durch ein Histogramm angezeigt, dem die idealerweise erwartete Normalverteilung als gestrichelte Linie überlagert ist.
Residuen Diese Seite zeigt die Residuen aufgetragen gegen die Objektnummer. Wenn man die Maus über die Punkte bewegt, wird der jeweils nächste Datenpunkt durch ein umschriebenes Quadrat markiert; die entsprechenden Koordinaten und der Objektname (Zeilenname in der Datenmatrix) werden rechts daneben angezeigt.
Details Der Reiter "Details" zeigt die mathematischen Details der Hauptkomponentenregression.

 


Last Update: 2012-Aug-07