IN DUBIO PRO GEO Anleitung : Wiederholungsbeobachtungen

In der Geodäsie und in anderen messenden Disziplinen wird eine Größe oft mehrmals unter denselben äußeren Bedingungen gemessen, um die Genauigkeit und Zuverlässigkeit zu erhöhen. Es wird angenommen, dass sich die Messwerte nur durch zufällige unabhängig identisch verteilte Messabweichungen unterscheiden. Solche Messwerte werden umfassend ausgewertet, einschließlich sämtlicher anwendbarer statistischer Tests. Statt geodätischer Messwerte können auch alle anderen derartigen Zufallsstichproben ausgewertet werden.

≡ START Erste Schritte English Empirische Streuungsmaße, Schiefe und Exzess-Kurtosis

Der Quartilabstand (auch Interquartilabstand) ist der Abstand des ersten und dritten Quartils (Viertelwerts). Innerhalb dieses Intervalls liegen 50% aller Werte einer Größe. Für die Berechnung des Quartilabstands werden mindestens 12 Messwerte benötigt.

Die Schiefe zeigt an, wie symmetrisch oder unsymmetrisch die Messwert-Verteilung ist.
Die Exzess-Kurtosis zeigt an, wie flach- oder steilgipflig die Messwert-Verteilung ist, im Vergleich zur Normalverteilung.

Schiefe	Verteilung	Exzess-Kurtosis	Verteilung
< 0	linksschief	< 0	flachgipflig
= 0	symmetrisch	= 0	normale Form (Gauß-Glocke)
> 0	rechtsschief	> 0	steilgipflig

≡ START Erste Schritte English Normalverteilungsplot

Dieser Plot stellt eine schnelle graphische Methode dar, um bei den Wiederholungsmessungen Abweichungen von der Normalverteilung festzustellen. Auf der horizontalen Achse sind die Messwerte aufgetragen und auf der vertikalen Achse die Mediane der zugehörigen normalen Ordnungsstatistiken. Im Fall einer Normalverteilung müssten alle Punkte im Plot etwa kollinear sein. Abweichungen davon können auf unsymmetrische (schiefe) oder steilgipflige, d.h. endlastige, oder flachgipflige Verteilungen hindeuten. Isoliert liegende Punkte links unten oder rechts oben in der Graphik sind ausreißerverdächtig.

≡ START Erste Schritte English Erläuterungen zu den statistischen Tests

Die Messwerte werden als unabhängige Realisierungen einer normalverteilten Zufallsvariable betrachtet. Wenn die Messwerte nur näherungsweise einer Normalverteilung folgen, liefern einige Tests immer noch korrekte Ergebnisse, wenn die Zahl der Messwerte nicht zu gering ist. Korrelationen würden das Ergebnis verfälschen.

Schon gewusst? Obwohl für die Messwerte alle möglichen Tests nacheinander berechnet werden, wäre es nicht korrekt , die Ergebnisse mehrerer Tests gleichzeitig zu benutzen, ohne die Wahrscheinlichkeit für Entscheidungsfehler erster Art α anzupassen. Möchte man mit denselben Messwerten einen multiplen Test durchführen, z.B. einen Ausreißertest und sodann einen Test des Erwartungswertes, dann muss berücksichtigt werden, dass die Gesamtwahrscheinlichkeit für Entscheidungsfehler erster Art α größer wird. Im einfachsten Fall von nahezu unabhängigen multiplen Teststatistiken muss nach der Bonferroni-Gleichung die gewünschte Gesamtwahrscheinlichkeit durch die Anzahl der Einzeltests dividiert werden, um zur für jeden Einzeltest einzustellenden Wahrscheinlichkeit α zu gelangen.

Alle Tests werden berechnet, die theoretisch berechenbar sind, selbst wenn ein anderer Test mit geringerer Wahrscheinlichkeit eine falsche Entscheidung herbeiführen würde. Beispiel: Ist die Standardabweichung der Messwerte a priori korrekt bekannt, führt der w-Test nach Baarda seltener eine falsche Entscheidung als der Pope-Test und der Gauß-Test seltener eine falsche Entscheidung als der t-Test herbei.

Annahmebereich : Die Nullhypothese H_o wird angenommen, wenn die Teststatistik

beim zweiseitigen Test zwischen die kritischen Werte c₁,c₂ fällt.

beim rechtsseitigen Test den kritischen Wert c₂ unterschreitet.

beim linksseitigen Test den kritischen Wert c₁ überschreitet.

Testverteilungen

N(μ,σ)	Normalverteilung mit Erwartungswert `μ` und Standardabweichung `σ`
t(r)	t-Verteilung mit `r` Freiheitsgraden
τ(r)	τ-Verteilung mit `r` Freiheitsgraden
χ²(r)	χ²-Verteilung mit `r` Freiheitsgraden
F(r,r')	F-Verteilung mit `r` und `r'` Freiheitsgraden

≡ START Erste Schritte English Anderson-Darling-Test auf Normalverteilung

Dieser Test überprüft für die Messwerte die Hypothese der Normalverteilung. Die Teststatistik bewertet die Differenz zwischen der empirischen Verteilung der Stichprobe und der Normalverteilung und gibt dabei mehr Gewicht auf die Enden der Verteilung, als klassische Tests wie z.B. der Cramér–von-Mises Test.

Der Anderson-Darling-Test wird in bis zu vier Varianten berechnet:

mit bekanntem Erwartungswert der Messwerte μ₀ und bekannter a priori Standardabweichung der Messwerte σ₀
mit bekanntem Wert σ₀
mit bekanntem Wert μ₀
ohne Einschränkungen der Verteilung

Die ersten drei Varianten setzen voraus, dass die erforderlichen Werte gegeben wurden.

≡ START Erste Schritte English Wiederholte Höhenbestimmung eines Punktes

Jährlich im dritten Semester werden im Studiengang Vermessung/ Geoinformatik der von jedem Studierenden tachymetrische Bestimmungen derselben Punkte vorgenommen. Diese können als unabhängige Wiederholungsmessungen angesehen werden. In den Jahren 2010 und 2011 wurden für einen ausgewählten Punkt folgende Ergebnisse erhalten:

Jahr	Bestimmungen der Punkthöhe, Einheit=Meter
2010	116.774 116.755 116.755 116.751 116.742 116.745 116.760 116.754 116.753 116.739 116.752 116.747 116.732 116.752 116.736 116.764 116.738 116.765 116.757 116.750 116.741 116.759 116.751 116.753 116.734 116.737 116.757 116.730 116.755
2011	116.764 116.748 116.758 116.743 116.757 116.659 116.744 116.754 116.761 116.762 116.769 116.741 116.747 116.738 116.744 116.750 116.746 116.736 116.760 116.762 116.760 116.756 116.739 116.754 116.728 116.745 116.737 116.750

Der Punkt hat im Übungnetz die bekannte Soll-Höhe 116.767 m . Von den Studierenden kann trotz fehlender Routine eine Bestimmung der Punkthöhe mit einer Standardabweichung von σ_o=0.01 m erwartet werden. Die Wiederholungsmessungen sollen mit einer Wahrscheinlichkeit für Entscheidungsfehler erster Art von α=0.05 statistisch getestet werden.

Der Normalverteilungsplot zeigt die Verteilung der Messwerte (Punkte) relativ zu einer am besten passenden Normalverteilung (Gerade) an. Sofort fällt auf, dass links unten ein roter (=2011) Punkt insoliert liegt. Dieser zeigt eindeutig einen Ausreißer an.
Die restlichen Punkte streuen etwa um die blaue (=2010) Gerade. Im mittleren Bereich der Punkte (rund um den Median) liegen die blauen (=2010) Punkte etwas weiter rechts, als die roten (=2011). Der Median der 2010er Messwerte ist also größer, nämlich um 3 mm.

Zunächst kann man untersuchen, ob die geforderte Messgenauigkeit erreicht wurde, ob also H_o:σ≤σ_o anzunehmen ist. Das überprüft der rechtsseitige Globaltest, der bei der Messreihe Jahr 2011 abgelehnt wird. Also wurde die Messgenauigkeit hier wahrscheinlich nicht erreicht. Genauer gesagt, die Wahrscheinlichkeit, dass die Messgenauigkeit erreicht und der Globaltest trotzdem abgelehnt wurde, beträgt α=0.05.

Auch der w-Test nach Baarda zeigt für Jahr 2011 einen Ausreißer an. Dies ist der Messwert 116.659, der am weitesten vom Mittelwert entfernt liegt. Eliminiert man diesen Wert und wiederholt die Auswertung, wird sowohl der linksseitige Globaltest, als auch der w-Test angenommen. Allerdings könnte irritieren, dass auch der rechtsseitige Globaltest H_o:σ≥σ_o angenommen wird. Die Ursache für dieses Phänomen ist folgende: Wenn α klein genug gewählt wird, werden die Nullhypothesen für alle statistischen Tests stets angenommen. Und für nur wenige Messwerte ist α=0.05 praktisch schon sehr klein.

Wäre σ_o=0.01 nicht bekannt gewesen, hätte man den Ausreißer hier auch mittels τ-Test nach Pope aufdecken können.

Die Standardabweichungen einer einzelnen Bestimmung der Punkthöhe werden jetzt a posteriori mit 0.0107 m für Jahr 2010 und 0.0102 m für Jahr 2011 ermittelt. Die Antwort auf die Frage, ob nach Eliminierung des Ausreißers die Messgenauigkeiten beider Jahre als gleich zu bewerten sind, liefert der zweiseitige F-Test mit H_o:σ_x=σ_y. Diese Hypothese wird angenommen, also war die Genauigkeit im Jahr 2011 nicht signifikant höher.

Die Mittelwerte betragen 116.7496 m für Jahr 2010 und 116.7501 m für Jahr 2011. Die Antwort auf die Frage, ob nach Eliminierung des Ausreißers die Erwartungswerte beider Messreihen als gleich zu bewerten sind, liefert der Zweistichproben-Gauß-Test mit H_o:μ_x=μ_y . Diese Hypothese wird angenommen, also sind die Erwartungswerte als gleich zu betrachten.

Die Hypothese, dass der als Sollhöhe des Punktes bisher verwendete Wert μ_o=116.767 mit den Mittelwerten identisch ist, ist Gegenstand des zweiseitigen Einstichproben-Gauß-Tests mit H_o:μ=μ_o . Diese Hypothese wird für beide Jahre abgelehnt. Die Schlussfolgerung könnte lauten, dass die Sollhöhe nicht korrekt ist, oder dass in beiden Jahren dieselben systematischen Messabweichungen auftraten. In diesem Fall ist nur denkbar, dass eine in allen Bestimmungen gemeinsam verwendete Anschlusshöhe falsch war und dies bei der Stationshöhenbestimmung nicht auffiel.

Da beide Messreihen keine signifikanten Unterschiede aufweisen, kann man diese zu einer Messreihe vereinen und die Auswertung wiederholen:

Genau wie in allen bisherigen Fällen wird die Sollhöhe μ_o=116.767 zurückgewiesen. Dieser Wert ist entweder nicht korrekt oder die Höhen wurden systematisch falsch erhalten. Außerdem wird die Hypothese der Normalverteilung mit dem Parameter μ_o=116.767 abgelehnt. Ohne diesen Parameter ist der Anderson-Darling-Test erfolgreich.

≡ START Erste Schritte English Probieren Sie dieses Rechenwerkzeug mit normalverteilten Pseudozufallszahlen aus

Zwei Reihen normalverteilter Pseudozufallszahlen N(53.06;16.10) aus www.random.org/gaussian-distributions werden untersucht.

≡ START Erste Schritte English Probieren Sie dieses Rechenwerkzeug mit anderen Pseudozufallszahlen aus

Eine Reihe Laplace-verteilter und eine Reihe χ²(1)-verteilter Pseudozufallszahlen, je 100 Werte, berechnet mit GNU Octave werden untersucht. Die wahren Parameter dieser Verteilungen sind

Reihe	Erwartungswert	Median	Standardabweichung	Quartilabstand	Schiefe	Exzess-Kurtosis
Laplace	0	0	1.414	1.386	0	3
χ²(1)	1	0.455	1.414	1.222	2.828	12

Schon gewusst? Alle Zahlen werden jederzeit mit Dezimalpunkt oder mit Dezimalkomma akzeptiert.

≡ START Erste Schritte English

Ausgleichungslehrbücher

Autor(en)	Titel	Jahr	Typ	Seiten MByte
Foppe K	Fehlerlehre und Statistik	2016	Lehr	94 0.9
Vermeer M	Statistical methods in geodesy	2015	Lehr	157 0.1
Lehmann R	On the formulation of the alternative hypothesis for geodetic outlier detection	2013	GruF	14 0.1
Lehmann R	On the formulation of the alternative hypothesis for geodetic outlier detection (postprint)	2013	GruF	20 1.3
Foppe K	Repetorium zur Fehlerlehre und Statistik und Ausgleichungsrechnung	2009	Lehr	87 1.9
Lehmann R	Das arithmetische Mittel von Mehrfachmessungen unter Wiederholbedingungen	2008	GruF	5 0.1
Koch KR	Parameterschätzung und Hypothesentests in linearen Modellen	2004	GruF	382 0.1
Tanizaki H	Computational Methods in Statistics and Econometrics	2004	Lehr	512 5.5

≡ START Erste Schritte English Anleitung : Wiederholungsbeobachtungen

Seiteninhalt