Konfidenzwahrscheinlichkeit. Definition von Konfidenzintervall und Konfidenzwahrscheinlichkeit

In dem sich mit der einen oder anderen Wahrscheinlichkeit der allgemeine Parameter befindet. Als ausreichend anerkannte Wahrscheinlichkeiten für eine sichere Beurteilung allgemeiner Parameter auf der Grundlage von Stichprobenindikatoren werden aufgerufen vertrauensvoll.

Das Konzept der Konfidenzwahrscheinlichkeiten basiert auf dem Grundsatz, dass unwahrscheinliche Ereignisse als praktisch unmöglich gelten und Ereignisse, deren Wahrscheinlichkeit nahe bei eins liegt, als nahezu sicher gelten. Typischerweise werden Wahrscheinlichkeiten P 1 = 0,95, P 2 = 0,99, P 3 = 0,999 als Konfidenzwahrscheinlichkeiten verwendet. Bestimmte Wahrscheinlichkeitswerte entsprechen Signifikanzniveaus, womit wir die Differenz α = 1-Р meinen. Eine Wahrscheinlichkeit von 0,95 entspricht einem Signifikanzniveau von α 1 = 0,05 (5 %), eine Wahrscheinlichkeit von 0,99 – α 2 = 0,01 (1 %), eine Wahrscheinlichkeit von 0,999 – α 3 = 0,001 (0,1 %).

Dies bedeutet, dass bei der Bewertung allgemeiner Parameter anhand von Stichprobenindikatoren im ersten Fall alle 20 Tests die Gefahr besteht, einen Fehler zu machen, d. h. in 5 % der Fälle; im zweiten - 1 Mal pro 100 Tests, d.h. in 1 % der Fälle; im dritten - 1 Mal pro 1000 Tests, d.h. in 0,1 % der Fälle. Das Signifikanzniveau bezeichnet also die Wahrscheinlichkeit, mit einer bestimmten Wahrscheinlichkeit eine zufällige Abweichung von den ermittelten Ergebnissen zu erhalten. Die als Konfidenz akzeptierten Wahrscheinlichkeiten bestimmen das Konfidenzintervall zwischen ihnen. Sie können verwendet werden, um eine Einschätzung einer bestimmten Größe und der Grenzen, innerhalb derer sie mit unterschiedlichen Wahrscheinlichkeiten liegen kann, zu ermöglichen.

Für verschiedene Wahrscheinlichkeiten lauten die Konfidenzintervalle wie folgt:

Р 1 = 0,95-Intervall - 1,96σ bis + 1,96σ (Abb. 5)

P 2 = 0,99 Intervall – 2,58σ bis + 2,58σ

P 3 = 0,999 Intervall – 3,03σ bis + 3,03σ

Die folgenden Werte der normalisierten Abweichungen entsprechen den Konfidenzwahrscheinlichkeiten:

Wahrscheinlichkeit P 1 = 0,95 entspricht t 1 = 1,96σ

Wahrscheinlichkeit P 2 = 0,99 entspricht t 2 = 2,58σ

Wahrscheinlichkeit P 3 = 0,999 entspricht t 3 = 3,03σ

Die Wahl der einen oder anderen Konfidenzschwelle basiert auf der Bedeutung des Ereignisses. Das Signifikanzniveau ist in diesem Fall die Wahrscheinlichkeit, mit der in einer bestimmten Studie oder einem bestimmten Phänomen entschieden wird, vernachlässigt zu werden.

Durchschnittlicher Fehler (m) oder Repräsentativitätsfehler.

Stichprobenmerkmale stimmen in der Regel absolut nicht mit den entsprechenden allgemeinen Parametern überein. Das Ausmaß der Abweichung eines Stichprobenindikators von seinem allgemeinen Parameter wird als statistischer Fehler oder Repräsentativitätsfehler bezeichnet. Statistische Fehler treten nur bei Stichprobenmerkmalen auf; sie entstehen bei der Auswahl einer Option aus der Grundgesamtheit.


Der durchschnittliche Fehler wird nach folgender Formel berechnet:

wobei σ die Standardabweichung ist,

n – Anzahl der Messungen (Stichprobengröße).

Ausgedrückt in den gleichen Einheiten wie .

Die Größe des durchschnittlichen Fehlers ist umgekehrt proportional zur Größe der Stichprobenpopulation. Wie größere Größen Stichproben, desto kleiner ist der durchschnittliche Fehler und desto geringer ist daher die Diskrepanz zwischen den Werten der Merkmale in der Stichprobe und den allgemeinen Grundgesamtheiten.

Der mittlere Stichprobenfehler kann zur Schätzung des allgemeinen Mittelwerts gemäß dem Gesetz der Normalverteilung verwendet werden. Somit liegen 68,3 % aller arithmetischen Mittelwerte der Stichprobe innerhalb von ±1, 95,5 % aller Stichprobenmittelwerte liegen innerhalb von ±2 und 99,7 % aller Stichprobenmittelwerte liegen innerhalb von ±3.

Das Konfidenzintervall stammt aus der Statistik. Hierbei handelt es sich um einen bestimmten Bereich, der dazu dient, einen unbekannten Parameter mit hoher Zuverlässigkeit abzuschätzen. Am einfachsten lässt sich das anhand eines Beispiels erklären.

Angenommen, Sie müssen eine Zufallsvariable untersuchen, beispielsweise die Antwortgeschwindigkeit des Servers auf eine Clientanfrage. Jedes Mal, wenn ein Benutzer die Adresse einer bestimmten Website eingibt, antwortet der Server mit mit unterschiedlichen Geschwindigkeiten. Daher ist die untersuchte Reaktionszeit zufällig. Das Konfidenzintervall ermöglicht es uns also, die Grenzen dieses Parameters zu bestimmen, und dann können wir sagen, dass der Server mit einer Wahrscheinlichkeit von 95 % in dem von uns berechneten Bereich liegt.

Oder Sie müssen herausfinden, wie viele Menschen davon wissen Warenzeichen Firmen. Bei der Berechnung des Konfidenzintervalls lässt sich beispielsweise sagen, dass der Anteil der Verbraucher, die sich dessen bewusst sind, mit einer Wahrscheinlichkeit von 95 % im Bereich von 27 % bis 34 % liegt.

Eng mit diesem Begriff verbunden ist der Wert der Konfidenzwahrscheinlichkeit. Es stellt die Wahrscheinlichkeit dar, dass der gewünschte Parameter im Konfidenzintervall enthalten ist. Wie groß unser gewünschter Bereich sein wird, hängt von diesem Wert ab. Je größer der Wert ist, desto enger wird das Konfidenzintervall und umgekehrt. Typischerweise ist er auf 90 %, 95 % oder 99 % eingestellt. Am beliebtesten ist der Wert 95 %.

Dieser Indikator wird auch durch die Streuung der Beobachtungen beeinflusst und seine Definition basiert auf der Annahme, dass das untersuchte Merkmal dieser Aussage gehorcht. Ihm zufolge ist eine solche Verteilung aller Wahrscheinlichkeiten eine stetige zufällige Variable, die durch eine Wahrscheinlichkeitsdichte beschrieben werden kann. Wenn die Annahme etwa Normalverteilung Sollte sich herausgestellt haben, dass die Einschätzung falsch ist, kann es sein, dass sie falsch ist.

Lassen Sie uns zunächst herausfinden, wie das Konfidenzintervall für berechnet wird. Hier gibt es zwei mögliche Fälle. Die Streuung (der Grad der Streuung einer Zufallsvariablen) kann bekannt sein oder auch nicht. Wenn es bekannt ist, wird unser Konfidenzintervall anhand der folgenden Formel berechnet:

xsr - t*σ / (sqrt(n))<= α <= хср + t*σ / (sqrt(n)), где

α - Zeichen,

t – Parameter aus der Laplace-Verteilungstabelle,

σ ist die Quadratwurzel der Varianz.

Wenn die Varianz unbekannt ist, kann sie berechnet werden, wenn wir alle Werte des gewünschten Merkmals kennen. Verwenden Sie dazu die folgende Formel:

σ2 = х2ср - (хср)2, wobei

х2ср – Durchschnittswert der Quadrate des untersuchten Merkmals,

(хср)2 ist das Quadrat dieser Charakteristik.

Die Formel, nach der das Konfidenzintervall berechnet wird, ändert sich in diesem Fall geringfügig:

xsr - t*s / (sqrt(n))<= α <= хср + t*s / (sqrt(n)), где

xsr – Stichprobendurchschnitt,

α - Zeichen,

t ist ein Parameter, der mithilfe der Student-Verteilungstabelle t = t(ɣ;n-1) ermittelt wird.

sqrt(n) – Quadratwurzel der gesamten Stichprobengröße,

s ist die Quadratwurzel der Varianz.

Betrachten Sie dieses Beispiel. Angenommen, auf der Grundlage der Ergebnisse von 7 Messungen wurde festgestellt, dass das untersuchte Merkmal gleich 30 und die Stichprobenvarianz gleich 36 ist. Es ist notwendig, mit einer Wahrscheinlichkeit von 99 % ein Konfidenzintervall zu finden, das das Wahre enthält Wert des gemessenen Parameters.

Lassen Sie uns zunächst bestimmen, was t ist: t = t (0,99; 7-1) = 3,71. Mit der obigen Formel erhalten wir:

xsr - t*s / (sqrt(n))<= α <= хср + t*s / (sqrt(n))

30 - 3,71*36 / (Quadrat(7))<= α <= 30 + 3.71*36 / (sqrt(7))

21.587 <= α <= 38.413

Das Konfidenzintervall für die Varianz wird sowohl im Fall eines bekannten Mittelwerts als auch dann berechnet, wenn keine Daten zum mathematischen Erwartungswert vorliegen und nur der Wert der punktuellen erwartungstreuen Schätzung der Varianz bekannt ist. Formeln zur Berechnung geben wir hier nicht an, da diese recht komplex sind und auf Wunsch immer im Internet zu finden sind.

Beachten wir nur, dass es praktisch ist, das Konfidenzintervall mit Excel oder einem so genannten Netzwerkdienst zu ermitteln.

Zuvor haben wir die Bestimmung der Konfidenzwahrscheinlichkeit für eine separate Messung X i anhand einer Tabelle betrachtet. 1.1, also die Bestimmung der Wahrscheinlichkeit, dass X i nicht mehr als ΔX vom wahren Wert abweicht.

Die wichtigste Aufgabe besteht jedoch darin, das Ausmaß der Abweichung vom wahren Wert X des arithmetischen Mittels zu bestimmen Messergebnisse. Um das Problem zu lösen, können Sie auch die Tabelle verwenden. 1.1, wobei anstelle des Wertes σ der Wert σ angenommen wird , also y / (n 0,5) oder unter Berücksichtigung von (1.14), für eine endliche Anzahl von Dimensionen

Mittlerer quadratischer Fehler des arithmetischen Mittels S n entspricht dem mittleren quadratischen Fehler eines einzelnen Ergebnisses dividiert durch die Quadratwurzel der Anzahl der Messungen.

Dies ist das Grundgesetz der zunehmenden Genauigkeit mit zunehmenden Beobachtungen. Daraus folgt, dass zur Erhöhung der Messgenauigkeit um das Zweifache die Anzahl der Messungen um das Vierfache erhöht werden muss. Diese Schlussfolgerung gilt jedoch nur für Messungen, bei denen die Genauigkeit des Ergebnisses vollständig durch zufällige Fehler bestimmt wird.

Normalerweise werden für n relativ wenige Messungen durchgeführt, aus denen der Wert S n bestimmt wird . Wenn wir bei der Beurteilung der Konfidenzwahrscheinlichkeit davon ausgehen, dass der Wert S n stimmt mit y überein und nutzen Sie die Tabelle. 1.1, dann erhalten wir überschätzte Werte von α. Aus der Tatsache, dass σ ist der Grenzwert von S n für n → ∞ folgt S n ist proportional zum Wert σ . Der Proportionalitätskoeffizient hängt von der Anzahl der Messungen ab und spiegelt den Näherungsgrad S n wider zu σ . Auf dieser Grundlage kann das Intervall ΔX dargestellt werden als:

Die Werte von t αn, Student-Koeffizient genannt, wurden für verschiedene Werte von n und α berechnet und sind in der Tabelle angegeben. 1.2. Vergleich der darin angegebenen Daten mit den Daten in der Tabelle. 1.1 ist leicht zu erkennen, dass für große n der Wert t αn zu den entsprechenden Werten des Wertes ε tendiert. Dies ist natürlich, da mit zunehmendem n S n tendiert zu σ .

Mithilfe der Student-Koeffizienten können wir die Gleichheit (1.14) in der Form umschreiben

Verwenden Sie dieses Verhältnis und diese Tabelle. 1.2 ist es einfach, Konfidenzintervalle und Konfidenzwahrscheinlichkeiten für eine beliebige kleine Anzahl von Messungen zu bestimmen. Nach der Durchführung der Messungen müssen alle in diesem Ausdruck enthaltenen Größen bekannt sein – einige davon können im Voraus angegeben werden, andere müssen ermittelt werden.

Ein Maß für die Genauigkeit von Messergebnissen ist der relative Fehler (Error), üblicherweise ausgedrückt in Prozent (%):


Der Wert ϕ = 1/δ, der Kehrwert des relativen Fehlers, wird als Messgenauigkeit bezeichnet.

Mit der Tabelle der Student-Koeffizienten können Sie auch das umgekehrte Problem lösen: Bestimmen Sie anhand des bekannten absoluten Fehlers des Messgeräts und eines gegebenen Zuverlässigkeitswerts die erforderliche Anzahl von Messungen in einer Reihe.

ANWENDUNG DER WAHRSCHEINLICHKEITSTHEORIE AUF DIE STATISTIK.

1. Grundkonzepte.

2. Bestimmung der unbekannten Verteilungsfunktion.

3. Bestimmung unbekannter Verteilungsparameter.

4. Konfidenzintervall. Konfidenzwahrscheinlichkeit.

5. Anwendung des Studententests zum allgemeinen Vergleich

Aggregate.

6. Elemente der Korrelationstheorie.

7. Testen der Hypothese über die Normalverteilung des Allgemeinen

Gesamtheit. Pearson-Anpassungstest.

Grundlegendes Konzept.

Mathematische Statistik ist ein Zweig der Mathematik, der Methoden zur Verarbeitung und Analyse experimenteller Daten untersucht, die als Ergebnis von Beobachtungen massiver Zufallsereignisse und -phänomene gewonnen werden.

Beobachtungen an Objekten können ausnahmslos alle Mitglieder der untersuchten Bevölkerung umfassen und können sich auf Erhebungen nur eines bestimmten Teils der Mitglieder dieser Bevölkerung beschränken. Die erste Beobachtung heißt kontinuierlich oder vollständig, die zweite teilweise oder selektiv .

Natürlich liefert die kontinuierliche Beobachtung die umfassendsten Informationen, aber nicht immer wird darauf zurückgegriffen. Erstens ist eine kontinuierliche Beobachtung sehr arbeitsintensiv und zweitens oft praktisch unmöglich oder sogar unpraktisch. Daher greifen sie in den allermeisten Fällen auf selektive Forschung zurück.

Eine Population, aus der einige ihrer Mitglieder auf irgendeine Weise für eine gemeinsame Untersuchung ausgewählt werden, wird genannt Durchschnittsbevölkerung , und ein auf die eine oder andere Weise ausgewählte Teil der Gesamtbevölkerung ist eine Stichprobenpopulation oder Probe .

Das Bevölkerungsvolumen ist theoretisch unbegrenzt, in der Praxis jedoch immer begrenzt.

Die Stichprobengröße kann groß oder klein sein, darf jedoch nicht weniger als zwei betragen.

Die Auswahl in die Stichprobe kann nach dem Zufallsprinzip (durch Los oder Lotterie) erfolgen. Oder geplant, je nach Aufgabenstellung und Organisation der Befragung. Damit die Stichprobe repräsentativ ist, ist es notwendig, auf die Variationsbreite des Merkmals zu achten und die Stichprobengröße darauf abzustimmen.

2. Bestimmung der unbekannten Verteilungsfunktion.

Also haben wir eine Auswahl getroffen. Unterteilen wir den Bereich der beobachteten Werte in Intervalle , , …. gleich lang. Um die erforderliche Anzahl an Intervallen abzuschätzen, können Sie die folgenden Formeln verwenden:

Als nächstes lassen m i - Anzahl der enthaltenen beobachteten Werte ich Th Intervall. Durch Teilen m i pro Gesamtzahl der Beobachtungen N, wir erhalten die entsprechende Frequenz ich-Oh Intervall: , und . Lassen Sie uns die folgende Tabelle erstellen:

Intervallnummer Intervall m i
m 1
m 2
... ... ... ...
k m k

Was heisst statistisch gesehen nah dran . Empirisch (oder statistisch ) Verteilungsfunktion Eine Zufallsvariable ist die Häufigkeit eines Ereignisses, bei der die Menge als Ergebnis eines Experiments einen Wert kleiner als annimmt X:

In der Praxis reicht es aus, die Werte der statistischen Verteilungsfunktion zu ermitteln F*(x) an Punkten , Welches sind die Grenzen der Intervalle der statistischen Reihe:

(5.2)

Es ist zu beachten, dass bei und bei . Durch Plotten der Punkte und wenn wir sie mit einer glatten Kurve verbinden, erhalten wir einen ungefähren Graphen der empirischen Verteilungsfunktion (Abb. 5.1). Mithilfe des Bernoullischen Gesetzes der großen Zahlen können wir beweisen, dass bei einer ausreichend großen Anzahl von Tests mit einer Wahrscheinlichkeit nahe Eins die empirische Verteilungsfunktion beliebig wenig von der Verteilungsfunktion der uns unbekannten Zufallsvariablen abweicht.

Anstatt die empirische Verteilungsfunktion darzustellen, geht man oft wie folgt vor. Auf der Abszissenachse sind Intervalle aufgetragen, ,…. . In jedem Intervall wird ein Rechteck konstruiert, dessen Fläche gleich der diesem Intervall entsprechenden Frequenz ist. Höhe Hi dieses Rechtecks ​​ist gleich , wobei die Länge jedes Intervalls ist. Es ist klar, dass die Summe der Flächen aller konstruierten Rechtecke gleich eins ist.

Betrachten wir eine Funktion, die im Intervall konstant und gleich ist. Der Graph dieser Funktion heißt Histogramm . Es handelt sich um eine Stufenlinie (Abb. 5.2). Mit dem Bernoullischen Gesetz der großen Zahlen lässt sich beweisen, dass für kleine und große Zahlen mit praktischer Sicherheit so wenig wie gewünscht von der Verteilungsdichte einer kontinuierlichen Zufallsvariablen abweicht.

Somit wird in der Praxis der Typ der unbekannten Verteilungsfunktion einer Zufallsvariablen bestimmt.

3. Bestimmung unbekannter Verteilungsparameter.

Somit haben wir ein Histogramm erhalten, das Klarheit schafft. Die Klarheit der präsentierten Ergebnisse ermöglicht es uns, verschiedene Schlussfolgerungen und Urteile über das Untersuchungsobjekt zu treffen.

Allerdings hören sie dabei meist nicht auf, sondern gehen noch weiter und analysieren die Daten, um bestimmte Annahmen über die möglichen Mechanismen der untersuchten Prozesse oder Phänomene zu testen.

Obwohl die Daten in jeder Umfrage relativ klein sind, möchten wir, dass die Ergebnisse der Analyse die gesamte tatsächliche oder denkbare Menge (d. h. die Bevölkerung) ausreichend beschreiben.

Dazu werden einige Annahmen darüber getroffen, wie sich die auf Basis experimenteller Daten (Stichprobe) berechneten Indikatoren zu den Parametern der Allgemeinbevölkerung verhalten.

Die Lösung dieses Problems ist ein wesentlicher Bestandteil jeder Analyse experimenteller Daten und steht in engem Zusammenhang mit der Verwendung einer Reihe oben diskutierter theoretischer Verteilungen.

Die weit verbreitete Verwendung der Normalverteilung in statistischen Schlussfolgerungen hat sowohl empirische als auch theoretische Berechtigung.

Erstens zeigt die Praxis, dass die Normalverteilung in vielen Fällen tatsächlich eine ziemlich genaue Darstellung experimenteller Daten ist.

Zweitens wurde theoretisch gezeigt, dass die Durchschnittswerte der Histogrammintervalle nach einem Gesetz nahe dem Normalwert verteilt sind.

Es sollte jedoch klar sein, dass die Normalverteilung nur ein rein mathematisches Hilfsmittel ist und es keineswegs notwendig ist, dass reale experimentelle Daten durch die Normalverteilung genau beschrieben werden. Obwohl in vielen Fällen ein kleiner Fehler berücksichtigt wird, können wir sagen, dass die Daten normalverteilt sind.

Eine Reihe von Indikatoren wie Mittelwert, Varianz usw. charakterisieren die Stichprobe und werden als Statistik bezeichnet. Dieselben Indikatoren, jedoch bezogen auf die Gesamtbevölkerung, werden als Parameter bezeichnet. Wir können also sagen, dass Statistiken dazu dienen, Parameter abzuschätzen.

Der allgemeine Durchschnitt ist das arithmetische Mittel der Werte Gesamtbevölkerungszahl:

Der Stichprobenmittelwert ist das arithmetische Mittel des Stichprobenvolumens:

(5.4)

wenn die Auswahl in Form einer Tabelle erfolgt.

Der Stichprobenmittelwert wird als Schätzung des allgemeinen Mittelwerts verwendet.

Die allgemeine Varianz ist das arithmetische Mittel der quadrierten Abweichungen der Grundgesamtheitswerte von ihrem Durchschnittswert:

Die allgemeine Standardabweichung ist die Quadratwurzel der allgemeinen Varianz: .

Die Stichprobenvarianz ist das arithmetische Mittel der Quadrate der Abweichung der Stichprobenwerte von ihrem Mittelwert:

Die Stichprobenstandardabweichung ist definiert als .

Um die experimentellen Ergebnisse besser abzugleichen, wird das Konzept der empirischen (oder korrigierten) Varianz eingeführt:

Um die allgemeine Standardabweichung zu schätzen, verwenden Sie die korrigierte Standardabweichung oder den empirischen Standard:

(5.5)

Für den Fall, dass alle Stichprobenwerte unterschiedlich sind, d.h. , , Formeln für und haben die Form:

(5.6)

Konfidenzintervall. Konfidenzwahrscheinlichkeit.

Die als Ergebnis der Berechnungen erhaltenen verschiedenen Statistiken sind Punktschätzungen der entsprechenden Parameter der Bevölkerung.

Wenn wir eine bestimmte Anzahl von Stichproben aus der Gesamtbevölkerung extrahieren und für jede von ihnen die für uns interessante Statistik finden, stellen die berechneten Werte Zufallsvariablen dar, die eine gewisse Streuung um den geschätzten Parameter aufweisen.

Als Ergebnis des Experiments steht dem Forscher jedoch in der Regel eine Probe zur Verfügung. Daher ist es von erheblichem Interesse, eine Intervallschätzung zu erhalten, d. h. ein bestimmtes Intervall, innerhalb dessen, wie man annehmen kann, der wahre Wert des Parameters liegt.

Als ausreichend anerkannte Wahrscheinlichkeiten für sichere Urteile über die Parameter der Grundgesamtheit auf der Grundlage von Statistiken werden als Konfidenz bezeichnet.

Überlegen Sie beispielsweise, wie Sie den Parameter schätzen.

Intervall

Die betrachteten Punktschätzungen der Verteilungsparameter liefern eine Schätzung in Form einer Zahl, die dem Wert des unbekannten Parameters am nächsten kommt. Solche Schätzungen werden nur für eine große Anzahl von Messungen verwendet. Je kleiner die Stichprobengröße, desto leichter ist es, bei der Auswahl eines Parameters einen Fehler zu machen. Für die Praxis ist es wichtig, nicht nur eine Punktschätzung zu erhalten, sondern auch das sogenannte Intervall zu bestimmen vertrauensvoll, zwischen den Grenzen davon mit einem gegebenen glaubwürdige Wahrscheinlichkeit

wobei q das Signifikanzniveau ist; x n, x b - die untere und obere Grenze des Intervalls, der wahre Wert des geschätzten Parameters wird gefunden.

Im Allgemeinen können Konfidenzintervalle basierend auf konstruiert werden Tschebyscheffs Ungleichungen. Für jedes Verteilungsgesetz einer Zufallsvariablen mit Momenten der ersten beiden Ordnungen wird die Obergrenze der Wahrscheinlichkeit, dass die Abweichung der Zufallsvariablen x vom Verteilungszentrum X c in das Intervall tS x fällt, durch die Tschebyscheff-Ungleichung beschrieben

wobei S x die Schätzung der Standardabweichung der Verteilung ist; t ist eine positive Zahl.

Um ein Konfidenzintervall zu finden, müssen Sie das Verteilungsgesetz der Beobachtungsergebnisse nicht kennen, aber Sie müssen die Schätzung der Standardabweichung kennen. Die mit der Tschebyscheff-Ungleichung ermittelten Intervalle erweisen sich für die Praxis als zu groß. Somit entspricht eine Konfidenzwahrscheinlichkeit von 0,9 für viele Verteilungsgesetze einem Konfidenzintervall von 1,6S X . Tschebyscheffs Ungleichung ergibt in diesem Fall 3,16S X. Aus diesem Grund hat es keine Verbreitung gefunden.

In der messtechnischen Praxis werden sie überwiegend eingesetzt Quantilschätzungen Konfidenzintervall. Unter 100P-Prozentquantil Unter x p versteht man die Abszisse einer solchen vertikalen Linie, links davon ist die Fläche unter der Verteilungsdichtekurve gleich P%. Mit anderen Worten, Quantil- Dies ist der Wert einer Zufallsvariablen (Fehler) mit einer gegebenen Konfidenzwahrscheinlichkeit P. Der Median der Verteilung ist beispielsweise das 50 %-Quantil x 0,5.

In der Praxis spricht man meist vom 25- und 75-%-Quantil falten, oder Quantile der Verteilung. Dazwischen liegen 50 % aller möglichen Werte der Zufallsvariablen und die restlichen 50 % liegen außerhalb. Das Werteintervall einer Zufallsvariablen x zwischen x 0 05 und x 0 95 deckt 90 % aller seiner möglichen Werte ab und heißt Interquantilintervall mit 90 % Wahrscheinlichkeit. Seine Länge beträgt d 0,9 = x 0,95 - x 0,05.

Basierend auf diesem Ansatz wird das Konzept vorgestellt Quantilfehlerwerte, diese. Fehlerwerte mit einer gegebenen Konfidenzwahrscheinlichkeit P – die Grenzen des Unsicherheitsintervalls ± D D = ± (x p – x 1-p)/2 = ± d p /2. Entlang seiner Länge treten P % der Werte der Zufallsvariablen (Fehler) auf und q = (1- P) % ihrer Gesamtzahl bleiben außerhalb dieses Intervalls.

Um eine Intervallschätzung einer normalverteilten Zufallsvariablen zu erhalten, ist Folgendes erforderlich:

Bestimmen Sie die Punktschätzung von MO x̅ und die Standardabweichung S x der Zufallsvariablen unter Verwendung der Formeln (6.8) bzw. (6.11);

Finden Sie die oberen x in- und unteren x n-Grenzen gemäß den Gleichungen

unter Berücksichtigung von (6.1) ermittelt. Die Werte von x n und x b werden aus Wertetabellen der Integralverteilungsfunktion F(t) oder der Laplace-Funktion Ф(1) ermittelt.

Das resultierende Konfidenzintervall erfüllt die Bedingung

wobei n die Anzahl der Messwerte ist; z p ist das Argument der Laplace-Funktion Ф(1), entsprechend der Wahrscheinlichkeit Р/2. In diesem Fall wird z p als Quantilfaktor bezeichnet. Die halbe Länge des Konfidenzintervalls wird als Vertrauensgrenze des Fehlers des Messergebnisses bezeichnet.

Beispiel 6.1. Es wurden 50 Messungen des konstanten Widerstands durchgeführt. Bestimmen Sie das Konfidenzintervall für den MO-Wert des konstanten Widerstands, wenn das Verteilungsgesetz normal ist mit den Parametern m x = R = 590 Ohm, S x = 90 Ohm und einer Konfidenzwahrscheinlichkeit von P = 0,9.

Da die Hypothese über die Normalität des Verteilungsgesetzes nicht im Widerspruch zu experimentellen Daten steht, wird das Konfidenzintervall durch die Formel bestimmt

Daher ist Ф(z ð) = 0,45. Aus der Tabelle in Anhang 1 finden wir, dass z p = 1,65. Daher wird das Konfidenzintervall wie folgt geschrieben:

Oder 590 - 21< R < 590 + 21. Окончательно 509 Ом < R < 611 Ом.

Wenn das Verteilungsgesetz einer Zufallsvariablen vom Normalverteilungsgesetz abweicht, ist es notwendig, ihr mathematisches Modell zu erstellen und damit das Konfidenzintervall zu bestimmen.

Die betrachtete Methode zur Ermittlung von Konfidenzintervallen gilt für eine ausreichend große Anzahl von Beobachtungen n, wenn s = S x. Es ist zu beachten, dass die berechnete Schätzung der Standardabweichung S x nur eine gewisse Annäherung an den wahren Wert von s darstellt. Die Bestimmung eines Konfidenzintervalls für eine gegebene Wahrscheinlichkeit erweist sich umso weniger zuverlässig, je kleiner die Anzahl der Beobachtungen ist. Es ist unmöglich, Normalverteilungsformeln bei einer kleinen Anzahl von Beobachtungen zu verwenden, wenn es nicht möglich ist, die Standardabweichung anhand von Vorversuchen mit einer ausreichend großen Anzahl von Beobachtungen theoretisch zu bestimmen.

Berechnung von Konfidenzintervallen für den Fall, dass die Verteilung der Beobachtungsergebnisse normal ist, ihre Varianz jedoch unbekannt ist, d. h. Mit einer kleinen Anzahl von Beobachtungen n ist es möglich, die Student-Verteilung S(t,k) zu verwenden. Es beschreibt die Verteilungsdichte des Verhältnisses (Student-Anteil):

wobei Q der wahre Wert der gemessenen Größe ist. Mengen x̅, S x. und S x ̅ werden auf der Grundlage experimenteller Daten berechnet und stellen Punktschätzungen von MO, Standardabweichung der Messergebnisse und Standardabweichung des arithmetischen Mittelwerts dar.

Die Wahrscheinlichkeit, dass der Student-Anteil aufgrund der gemachten Beobachtungen im Intervall (- t p ; + t p) einen bestimmten Wert annimmt

wobei k die Anzahl der Freiheitsgrade gleich (n – 1) ist. Die Werte von t p (in diesem Fall genannt Studentenkoeffizienten), berechnet mit den letzten beiden Formeln für verschiedene Werte der Konfidenzwahrscheinlichkeit und der Anzahl der Messungen, werden tabellarisch aufgeführt (siehe Tabelle in Anhang 1). Mithilfe der Student-Verteilung können Sie daher die Wahrscheinlichkeit ermitteln, dass die Abweichung des arithmetischen Mittels vom wahren Wert den gemessenen Wert nicht überschreitet

In Fällen, in denen die Verteilung zufälliger Fehler nicht normal ist, wird häufig die Student-Verteilung mit einer Näherung verwendet, deren Grad unbekannt bleibt. Die Student-Verteilung wird für eine Reihe von Messungen n verwendet< 30, поскольку уже при n = 20, ...,30 оно переходит в нормальное и вместо уравнения (6.14) можно использовать уравнение (6.13). Результат измерения записывается в виде: ; P = Р d, wobei Р d ein spezifischer Konfidenzwahrscheinlichkeitswert ist. Der Faktor t ist für eine große Anzahl von Messungen n gleich dem Quantilfaktor z p. Für kleine n ist es gleich dem Student-Koeffizienten.

Das resultierende Messergebnis ist keine bestimmte Zahl, sondern stellt ein Intervall dar, in dem mit einer bestimmten Wahrscheinlichkeit P d der wahre Wert des Messwerts liegt. Das Hervorheben der Mitte des Intervalls x bedeutet keineswegs, dass der wahre Wert näher an dieser liegt als an den anderen Punkten des Intervalls. Es kann überall im Intervall liegen und mit einer Wahrscheinlichkeit von 1 - Р d sogar außerhalb.

Beispiel 6.2. Die Bestimmung der spezifischen magnetischen Verluste für verschiedene Proben einer Charge Elektrostahl der Sorte 2212 ergab folgende Ergebnisse: 1,21; 1,17; 1,18; 1,13; 1,19; 1,14; 1,20 und 1,18 W/kg. Unter der Annahme, dass kein systematischer Fehler vorliegt und der Zufallsfehler normalverteilt ist, ist es notwendig, das Konfidenzintervall bei Kovon 0,9 und 0,95 zu bestimmen. Um das Problem zu lösen, verwenden Sie die Laplace-Formel und die Student-Verteilung.

Mithilfe der Formeln (6.8) in (6.11) finden wir Schätzungen des arithmetischen Mittelwerts und der Standardabweichung der Messergebnisse. Sie betragen 1,18 bzw. 0,0278 W/kg. Unter der Annahme, dass die MSD-Schätzung gleich der Abweichung selbst ist, finden wir:

Von hier aus bestimmen wir dies anhand der in der Tabelle in Anhang 1 angegebenen Werte der Laplace-Funktion z p= 1,65. Für P = 0,95 ist der Z-Koeffizient p = 1,96. Die Konfidenzintervalle entsprechend P = 0,9 und 0,95 betragen 1,18 ± 0,016 und 1,18 ± 0,019 W/kg.

Gemäß der Tabelle in Anhang 1 finden wir t 0,9 = 1,9 und t 0,95 = 2,37. Daher betragen die Konfidenzintervalle 1,18 ± 0,019 bzw. 1,18 ± 0,023 W/kg.