DataLab ist ein kompaktes Statistikprogramm zur explorativen Datenanalyse. Weitere Informationen finden Sie auf den DataLab Webseiten ....



Datensatz aufspalten

Befehl: Werkzeuge -> Datensatz aufspalten...

Während einer Datenanalyse ist es oft notwendig, mehrere unabhängige Teilmengen eines Datensatzes zu erzeugen, die als Trainings- und Testmenge verwendet werden können. DataLab bietet daher zwei Möglichkeiten, solche Teilmengen zu erstellen: (1) Das Ziehen von unabhängigen Stichproben, und (2) das Aufsplitten eines Datensatzes ohne dessen Anordnung der Daten zu verändern. Zusätzlich kann eine Datenmenge auch zeilen- oder spaltenweise aufgetrennt werden.

Nachdem Werkzeuge/Datensatz aufspalten... angeklickt wurde, wird ein Fenster mit den Einstellungen angezeigt, das dem Benutzer die Möglichkeit gibt, die Zahl der zu erzeugenden Dateien und den Modus des Probenziehens festzulegen (Zufallsstichproben, blockweise oder abwechselnd, und spalten- oder zeilenweise). Die Teilmengen werden aus der aktuellen Datenmatrix erstellt und im ASC-Format im aktuellen Arbeitsverzeichnis gespeichert.

Die Benennung der Datensätze erfolgt automatisch aus dem Namen des Originaldatensatzes, der mit einer fortlaufenden Nummer erweitert wird. Falls ein nicht benannter Datensatz aufgespalten wird, werden die Teile unter dem Namen "noname_xx.asc" gespeichert.

Die Erstellung der Teilmengen erfolgt durch Anklicken des Befehls Ausführen.


Last Update: 2011-Nov-06