ProSTatist - Kein Buch mit sieben Siegeln

Bild 1: Die Menüs von ProSTatist sind in einer strengen logischen Arbeitsabfolge aufgebaut

Ich hörte einmal den sinnigen Spruch: “Mit Statistik können Sie alles und auch nichts beweisen.” Der Urheber dieser Feststellung hatte offenbar schlechte Erfahrungen mit ‚der Statistik’ gemacht. Oder war es die Undurchsichtigkeit verschiedener mathematischer Verfahren, die ihn zu den zitierten Worten bewog? Natürlich ist die Statistik nicht eine Wissenschaft von höheren Weihen, die auf irgendwelchen rätselhaften Wegen zu noch unerklärlicheren Ergebnissen kommt. Es wird wohl so sein müssen, daß sich der Anwender genaue Gedanken über das Instrumentarium machen muß und deswegen auch genau wissen sollte, welche statistischen Verfahren für welche Berechnungen die richtigen sind. Es genügt eben nicht, Daten einfach einzugeben und per Knopfdruck fertige (und dann auch noch genau die passenden) Ergebnisse zu erwarten.

Statistik ist die Wissenschaft von der freien Interpretation mathematischer Resultate (waghalsige Definition des Autors nach dem Genuß einer Vorlesung in höherer Mathematik).

Programme für statistische Berechnungen gibt es nicht unbedingt wie Sand am Meer und noch weniger für den ATARI ST. Es genügt auch nicht (per ausgefeiltem Algorithmus), möglichst viele Formeln und Testverfahren zu diesem Thema in einem Programm zusammenzupacken, und schon garnicht muß bis auf die xy-ste Stelle hinter dem Komma exakt genau gerechnet werden.

ProSTatist, das sogenannte “flexible Statistik-Programm“ der Firma ST Profi-Partner in Lübeck ist in Omikron-Basic (V 3.0) erstellt worden. Gerade die mathematische Genauigkeit dieser Basic-Version gab den Ausschlag.

Ungewöhnlich ist, was sich nach dem Programmstart zeigt: Eine Grafik deutet als x/y-Diagramm an, wieviele Variablen und wieviel Daten pro Variable bei der verfügbaren Speicherkapazität möglich sind. So kann man schon hier exakt die maximale Auslastung des Arbeitsspeichers kalkulieren. Üblich ist es ja, daß man zu Beginn statistischer Berechnung durchaus weiß, wieviele Meßdaten vorliegen. Dementsprechend kann die Speicherauslastung gewählt werden - es ist gewissermaßen ein Wechselspiel zwischen Variablenanzahl und Anzahl der Werte.

GEM oder nicht GEM?

Ungewöhnlich ist auch, daß man die Maus für fast alle Arbeiten getrost beiseite legen kann. Die berühmte Gretchenfrage an den Programmierer: “Sag, wie hältst es Du mit GEM?“ wird eindeutig beantwortet: “GEM, nein danke!“

Jetzt kann man natürlich darüber wieder stundenlang streiten, warum der Programmierer auf GEM verzichtet hat. Meiner Ansicht nach war es bei diesem Programm sogar eine richtige Entscheidung auf Eingabeumwege per Maus zu verzichten. Überlegen wir doch mal: Bei der Statistik müssen viele Zahlen eingetippt werden. Übliche Funktionen, die per Maus recht flott funktionieren, wie Symbole verschieben, Rahmen ziehen, unzählige Menüs anklicken - das alles fällt in ProSTatist doch völlig weg. Wenn die Zahlenkolonnen erst einmal im RAM sind, genügt eine kurze Anwahl mit eins/zwei/drei Tastendrücken, und schon liegt eine komplette Auswertung vor. ALSO: Maus muß nicht sein!

Definitionen

Eines ist sicher, entweder Sie haben Mathematik studiert (das ist gut), oder Sie sind Mathe-Professor (das ist besser), oder Sie haben von Statistik durchaus Ahnung, aber eine wahnsinnige Geduld (das ist am besten). Bei Statistikprogrammen müssen Sie lernen, lernen, lernen - vor allem Definitionen.

Zunächst einmal ist alles, was an statistischen Werten hereinkommt, eine ‚Stichprobe’. Innerhalb einer Stichprobe gibt es eine (üblicherweise) unterschiedlich große Ansammlung von Zahlen, die Elemente heißen. Wenn die einzelnen Stichproben nichts miteinander zu tun haben, also keinen Bezug oder eine Abhängigkeit zueinander besitzen, dann heißen sie ‚unabhängig’. Das Gegenteil davon nennt man ‚abhängig’, weil dort die Stichproben in einem Zusammenhang zueinander stehen. Jede solcher abhängigen Stichproben repräsentiert ein bestimmtes Merkmal, und die Zahlen geben die Ausprägung des Merkmals wieder. Dann hat auch jede Stichprobe die gleiche Anzahl von Elementen. Eine Stichprobe nimmt mit ihren Zahlen eine senkrechte Anordnung vor, vergleichbar mit einer Spalte in der Tabellenkalkulation, diese heißt ‚Variable’ (Ähnlichkeiten mit Begriffen und deren Bedeutung in der Informatik wären rein zufällig) oder ‚Datengruppe’.

Soweit zunächst der kleine Ausflug in das Mathematiklexikon und zurück zu ProSTatist. Noch bevor man die eigentlichen Daten eingeben darf, soll entschieden werden, ob es sich um einzelne Datenpunkte (unabhängige) oder um Gruppen von Daten bzw. Variablen (abhängige) handelt. Dies ist für die weitere Behandlung der Zahlenreihen durch das Programm wichtig. Mit den eingegebenen Zahlen kann nun das komplette Instrumentarium der Statistik durchgespielt werden: Häufigkeitsverteilung, Normalverteilung, Kennwerte usw. Es würde den Rahmen dieses Berichtes sprengen, wenn wir auf alle möglichen Testverfahren eingehen müßten. Außerdem wäre es schon fast eine Lebensaufgabe, alle Tests und Analysen zu erläutern.

ProSTatist hält eine stattliche Anzahl an mathematischem Werkzeug bereit. Eine kleine Liste soll (hauptsächlich für den Fachmann) diese kurz beschreiben.

Bild 2: Alle Test- und Analyseverfahren im Überblick
Bild 3: Das Hauptmenü: Schnelle Anwahl der Unterverzeichnisse per Tastatur. Verschiedene Systeminformationen stehen in der Kopfleiste.
Bild 4: Wenn zuviel Abhängigkeiten gezeigt werden sollen und zudem verschiedene Gruppen im unmittelbaren Vergleich, dann legt man Linienzüge übereinander.
Bild 5: Ein 3D-Bild zeigt eine Mengenlandschaft, nur ist die Darstellung hier noch nicht automatisch.

Programmaufteilung

Die einzelnen Funktionskreise sind gut gegliedert und streng voneinander in 9 Untermenüs getrennt.

Menü 1: Dort wird die Eingabe der Einzelwerte abgehandelt. Entweder geschieht eine manuelle Dateneingabe oder ein Lesen aus einer Datei.

Menü 2: Eine kleine Sammlung von verschiedenen Darstellungsmöglichkeiten bietet sich hier. Über die Auswertung der Häufigkeits- und Normalverteilung und den Nullklassentest führen die grafischen Mittel zu Punktwolke, Balkendiagramm, Polygonzug, Kreisdiagramm und Variablenrapport.

Menü 3: Die Beschreibung der statistischen Kennwerte reicht von Mittelwert über Median, geometrisches und harmonisches Mittel über Varianz bis hin zu Standardabweichung, Schiefe und Exzeß.

Menü 4: Durch sogenannte ‚Tendenzen’ kann geprüft werden, ob die Meßergebnisse im Zusammenhang mit bestimmten Annahmen (Hypothesen) stehen, ob Abweichungen davon mit einer bestimmten Wahrscheinlichkeit zufällig oder bedeutungsvoll (signifikant) sind. Dieses Menü enthält die umfangreichsten Prüfverfahren und wird mit ‚Unterschiede absichern’ überschrieben. Das heißt ganz allgemein, daß mit den Tendenzen getestet wird, ob sich eine gewisse Anzahl an Werten um einen bestimmten Punkt gruppiert. Das heißt speziell, daß eine Verteilung mehrerer Stichproben um einen Punkt beobachtet und beurteilt wird, wie sich diese Punkte in welcher Form dort verhalten. Es können die unterschiedlichsten Tabellen und grafischen Darstellungen gewählt werden.

Menü 5: Zusammenhänge prüfen. Die gesamte Korrelationsrechnung in allen ihren Spielarten dient nur dem Zweck, den Grad eines Zusammenhangs zweier Variablen zu prüfen.

Menü 6: Regression berechnen. Wenn aus der Korrelation schließlich ein Zusammenhang erkannt und bestätigt wurde, dann wird die Regressionsrechnung angewandt, um eine bekannte mathematische Formel zu finden, damit die Werte der einen Variablen in die der anderen überführt werden können. Auch hier ist das Werkzeug sehr umfangreich als Tabellen und grafischen Schaubildern zu finden.

Menü 7: Faktorenanalyse. Wenn eine größere Anzahl von Merkmalen bewiesenermaßen voneinander abhängig ist. kann dies auf eine kleinere Anzahl unabhängiger Einflußgrößen (genannt ‚Faktoren’) zurückgeführt werden. In der Faktorenanalyse wird dies durch sogenannte agglomerative Verfahren erreicht.

Menü 8: Varianzanalyse. Kurz gesagt, hier wird auf ‚Nummer sicher’ gebaut. Das bedeutet, es kommen verschiedene Verfahren zur Anwendung, die eine statistische Sicherheit berechnen (gewissermaßen die Gegenprobe). Meistens kommen als Bestätigung für fehlerfreies Arbeiten (und Denken) die 100% heraus.

Menü 9: Theoretische Verteilungen, Wahrscheinlichkeitsdichte, Freiheitsgrade, Verteilungsfunktion und Schranken sind die Schlagworte dieses Kapitels. Verfechter der Statistik benutzen dieses Werkzeug zur Untermauerung waghal siger Thesen und ein kleinwenig in Richtung Spekulation. Will heißen: Hier wird’s nun aber sehr theoretisch und für den Durchschnittsmathematiker kaum noch nachvollziehbar.

Handhabung

Wenn man länger mit ProSTatist arbeitet, fällt der Verlust der Maus fast nicht mehr ins Gewicht. Man ist schnell in den entsprechenden Untermenüs. Nur eines fallt etwas unangenehm ins Gewicht: das Beenden verschiedener Untermenüs oder Eingabefelder wird durch viele verschiedene Befehle erreicht. Einmal mußte ich “E“ für Ende, anderes Mal eine “0“ und ein weiteres Mal das komplette Wort “Exit“ eintippen. Man muß also ständig nachschauen, wie man dieses Menü beenden kann.

Eine durchgängige Benutzerführung mit einheitlichen Tastenfunktionen wäre sicher von Vorteil.

Sehr zu loben ist der hierarchische Aufbau der Menüs und Unterverzeichnisse. So gelangt man von den einfachen Funktionen der Menüs 1 bis 3 in logischer Reihenfolge über die verschiedenen aufbauen den Test- und Analyseverfahren bis hin zu den höchsten ‚Etagen’ der Theorie in Menü 9.

Grafik

Es dürfte einleuchten, daß es nicht ausreicht, massenweise Zahlenkolonnen einzutippen, nur um wiederum massenweise Ergebnisse in Kolonnenform auszudrucken. Die statistische Beschreibung diverser Vorgänge und Abhängigkeiten steht und fällt mit der Übersichtlichkeit. Deswegen ist es unverzichtbar (und vielleicht das Wichtigste überhaupt in der Statistik) Resultate grafisch darzustellen.

In ProSTatist ist dies auch oft die zwangsläufige Fortführung in den Menüs - eine Grafik kommt garantiert. Die Palette ist nicht unbedingt sehr groß, aber ausreichend: Balken- oder Tortendiagramm, Linienzug oder Punktwolke.

Alle Grafiken dimensionieren sich zunächst selbst. D.h. der Maßstab und die Minimal/Maximalschranken stellt das Programm aus den gegebenen Werten fest und gestaltet darin die Grafik. Manchmal wird auch eine Veränderung der Grafik durch manuelle Eingabe fester Grenzen erlaubt.

ProSTatist - im Ganzen gesehen

ProSTatist ist sicher ein interessantes Programm für die “Hobby-Statisten“ (oder wie heißen die noch gleich?), aber durch seine Funktionsvielfalt bestimmt auch eine große Hilfe für den Profi. Bezüglich der Arbeitsgeschwindigkeit kann ich mir mangels Vergleichsprodukten leider kein objektives Bild machen - ein subjektives sei mir dennoch erlaubt: Wenn man vom Grafikaufbau ausgeht, ist ProSTatist ganz schön fix. Alles andere was sich im RAM abspielt, entzieht sich leider unserem Einblick. Nur das mit knapp 130 Seiten sehr ausführliche und mustergültige Handbuch vermittelt einen ungefähren Eindruck, welche Arbeit ProSTatist zu leisten in der Lage ist.

DK

Bezugsadresse

ST Profi Partner Mönkhofer Weg 126 2400 Lübeck



Aus: ST-Computer 02 / 1990, Seite 70

Links

Copyright-Bestimmungen: siehe Über diese Seite