Wednesday, 22 February 2017

Testen Sie Den Unterschied Zwischen Zwei Mittel In Stata Forex

Unabhängiger t-Test mit Stata Einleitung Der unabhängige t-Test, der auch als unabhängiger Stichproben-t-Test bezeichnet wird, misst t-Test oder unpaarten t-Test, ob der Mittelwert einer abhängigen Variablen (z Gewicht, Angstgehalt, Gehalt, Reaktionszeit usw.) ist in zwei unabhängigen Gruppen unabhängig voneinander (zB Männer, Frauen, Männer, Männer, Männer und Männer). Speziell verwenden Sie einen unabhängigen t-Test, um festzustellen, ob der mittlere Unterschied zwischen zwei Gruppen statistisch signifikant verschieden von Null ist. Zum Beispiel könnte ein unabhängiger t-Test verwendet werden, um zu testen, ob die Revisionszeit unter den Studenten je nach Geschlecht unterschiedlich war (dh Ihre abhängige Variable wäre Revisionszeit, in Minuten oder Stunden gemessen und Ihre unabhängige Variable wäre das Geschlecht, das zwei hat Gruppen: männlich und weiblich). Alternativ könnte ein unabhängiger t-Test verwendet werden, um zu verstehen, ob es einen Unterschied im Gehalt auf der Grundlage von Bildungsniveau (dh Ihre abhängige Variable wäre Gehalt und Ihre unabhängige Variable wäre Bildungsniveau, die zwei Gruppen: Undergraduate-Abschluss und Postgraduierten-Grad hat ). Hinweis: In Stata 12 sehen Sie, dass der unabhängige t-Test als zweistufiger Mittelwertvergleichstest bezeichnet wird, während er in der Stata 13 als t-Test bezeichnet wird (Mittelwertvergleichstest). In dieser Anleitung zeigen wir Ihnen, wie Sie einen unabhängigen t-Test mit Stata durchführen sowie die Ergebnisse aus diesem Test interpretieren und melden können. Bevor wir Ihnen dieses Verfahren vorstellen, müssen Sie jedoch die unterschiedlichen Annahmen verstehen, die Ihre Daten erfüllen müssen, damit ein unabhängiger t-Test ein gültiges Ergebnis liefert. Wir diskutieren diese Annahmen als nächstes. Hinweis: Wenn Ihre unabhängige Variable über verwandte Gruppen verfügt, müssen Sie stattdessen einen gepaarten t-Test verwenden. Alternativ können Sie, wenn Sie mehr als zwei unabhängige Gruppen haben, eine einseitige ANOVA verwenden. Wenn Sie jedoch nur eine Gruppe haben und diese mit einem bekannten oder hypothetischen Wert vergleichen möchten, können Sie einen Ein-Stichproben-Test durchführen. Wir haben auch eine Anleitung, wie man einen unabhängigen t-Test mit Minitab laufen kann. Annahmen Es gibt sechs Annahmen, die den unabhängigen t-Test untermauern. Wenn eine dieser sechs Annahmen nicht erfüllt ist, können Sie Ihre Daten nicht mit einem unabhängigen t-Test analysieren, da Sie kein gültiges Ergebnis erhalten. Da sich die Annahmen 1, 2 und 3 auf das Studiendesign und die Wahl der Variablen beziehen, können sie nicht auf die Verwendung von Stata getestet werden. Allerdings sollten Sie entscheiden, ob Ihre Studie erfüllt diese Annahmen, bevor Sie fortfahren. Annahme 1: Ihre abhängige Variable sollte im Intervall oder Verhältnis-Ebene (d. H. Sie sind kontinuierlich) gemessen werden. Beispiele für derartige abhängige Variablen sind die Höhe (gemessen in Fuß und Inch), die Temperatur (gemessen in ° C), das Gehalt (gemessen in US-Dollar), die Revisionszeit (gemessen in Stunden), die Intelligenz (gemessen mit IQ - Gemessen in Millisekunden), Testleistung (gemessen von 0 bis 100), Umsatz (gemessen in Anzahl der Transaktionen pro Monat) und so weiter. Wenn Sie nicht sicher sind, ob Ihre abhängige Variable kontinuierlich ist (d. h. auf der Intervall - oder der Verhältnisstufe), finden Sie in unseren Variablen-Typen. Annahme 2: Ihre unabhängige Variable sollte aus zwei kategorischen bestehen. Unabhängigen (unabhängigen) Gruppen. Beispiele für solche unabhängigen Variablen sind Geschlecht (2 Gruppen: männlich oder weiblich), Behandlungsart (2 Gruppen: Medikamente oder keine Medikamente), Bildungsniveau (2 Gruppen: Studierende oder Doktoranden), religiöse (2 Gruppen: ja oder nein) und So weiter. Annahme 3: Sie sollten die Unabhängigkeit der Beobachtungen haben. Was bedeutet, dass es keine Beziehung zwischen den Beobachtungen in jeder Gruppe oder zwischen den Gruppen selbst gibt. Beispielsweise müssen in jeder Gruppe unterschiedliche Teilnehmer vorhanden sein, wobei kein Teilnehmer mehr als eine Gruppe hat. Wenn Sie keine Unabhängigkeit von Beobachtungen haben, ist es wahrscheinlich, dass Sie verwandte Gruppen haben, dh Sie müssen einen abhängigen t-Test anstelle des unabhängigen t-Tests verwenden. Glücklicherweise können Sie Annahmen 4, 5 und 6 mit Stata überprüfen. Wenn wir uns auf die Annahmen 4, 5 und 6 begeben, empfehlen wir, diese in dieser Reihenfolge zu testen, da sie eine Bestellung darstellt, bei der ein Verstoß gegen die Annahme nicht mehr korrigierbar ist, können Sie keinen unabhängigen t-Test mehr verwenden. In der Tat, nicht wundern, wenn Ihre Daten nicht eine oder mehrere dieser Annahmen, da dies ziemlich typisch ist, wenn mit realen Daten anstatt Lehrbuch Beispiele, die oft nur zeigen, wie man einen unabhängigen t-Test, wenn alles läuft gut. Jedoch sorgen Sie sich nicht, weil, selbst wenn Ihre Daten bestimmte Annahmen ausfallen, es häufig eine Lösung gibt, zum dieses zu überwinden (zB Ihre Daten zu verwandeln oder einen anderen statistischen Test anstatt zu verwenden). Denken Sie daran, dass die Ergebnisse, die Sie beim Ausführen eines unabhängigen t-Tests erhalten, nicht gültig sind, wenn Sie nicht überprüfen, ob Ihre Daten diese Annahmen erfüllen oder ob Sie sie falsch testen. Annahme 4: Es sollten keine signifikanten Ausreißer vorhanden sein. Ein Ausreißer ist einfach ein einziger Fall in Ihrem Datensatz, der nicht dem üblichen Muster folgt (z. B. in einer Studie von 100 Studenten IQ Scores, wo die mittlere Punktzahl 108 mit nur einer kleinen Abweichung zwischen den Schülern war, hatte ein Schüler eine Punktzahl von 156 , Die sehr ungewöhnlich ist, und kann sogar setzen sie in die Top 1 der IQ-Scores global). Das Problem mit Ausreißern ist, dass sie einen negativen Effekt auf den unabhängigen t-Test haben können, was die Genauigkeit Ihrer Ergebnisse verringert. Glücklicherweise, wenn Sie Stata verwenden, um eine unabhängige t-Test auf Ihre Daten laufen, können Sie leicht erkennen mögliche Ausreißer. Annahme 5: Ihre abhängige Variable sollte für jede Kategorie der unabhängigen Variablen ungefähr normal verteilt sein. Ihre Daten müssen für den Betrieb eines unabhängigen t-Tests nur annähernd normal sein, da sie sehr robust sind gegen Verletzungen der Normalität, was bedeutet, dass diese Annahme ein wenig verletzt werden kann und dennoch gültige Ergebnisse liefert. Sie können auf Normalität mit dem Shapiro-Wilk-Test der Normalität testen, die leicht für die Verwendung von Stata getestet wird. Annahme 6: Es muss Homogenität von Abweichungen bestehen. Sie können diese Annahme in Stata mit Levenes-Test für Homogenität von Varianzen testen. Levenes-Test ist sehr wichtig, wenn es darum geht, die Ergebnisse aus einer unabhängigen t-Test-Leitfaden zu interpretieren, weil Stata in der Lage ist, produzieren unterschiedliche Ausgabe je nachdem, ob Ihre Daten erfüllt oder nicht diese Annahme. In der Praxis wird die Überprüfung der Annahmen 4, 5 und 6 voraussichtlich die meiste Zeit in Anspruch nehmen, wenn ein unabhängiger t-Test durchgeführt wird. Allerdings ist es keine schwierige Aufgabe, und Stata bietet alle Werkzeuge, die Sie benötigen, um dies zu tun. Im Abschnitt Testverfahren in Stata. Veranschaulichen wir die Stata-Prozedur, die erforderlich ist, um einen unabhängigen t-Test unter der Annahme durchzuführen, dass keine Annahmen verletzt worden sind. Zunächst beschreiben wir das Beispiel, mit dem wir das unabhängige t-Testverfahren in Stata erklären. Mit einem großen Teil der schweren Raucher kämpfen, um zu beenden, will die Regierung Wege finden, um ihnen helfen, reduzieren ihre Zigarettenkonsum. Ein Forscher möchte untersuchen, ob die Verwendung von Nikotinpflaster den Zigarettenkonsum reduziert und wenn ja, um wie viel. Daher rekrutiert der Forscher eine Stichprobe von 30 starken Rauchern aus der Bevölkerung, wobei ein starker Raucher als eine Person definiert ist, die durchschnittlich 40 Zigaretten oder mehr pro Tag raucht. Diese Stichprobe von 30 Teilnehmern wurde zufällig in zwei unabhängige Gruppen ndash eine Kontrollgruppe und eine Behandlungsgruppe ndash mit 15 Teilnehmern in jeder Gruppe aufgeteilt. Daher erhielten 15 Teilnehmer die Nikotinpflaster (die Behandlungsgruppe) und 15 Teilnehmer erhielten ein Placebo, dh ein Pflaster, das kein Nikotin (die Kontrollgruppe) enthielt. Infolgedessen wusste keiner der Teilnehmer, ob sie in der Behandlungsgruppe oder der Kontrollgruppe waren. Drei Monate nach Beginn des Experiments wurde der Zigarettenkonsum der beiden Gruppen anhand der durchschnittlichen Anzahl der pro Tag gerauchten Zigaretten gemessen. Daher war die abhängige Variable der Zigarettenkonsum (gemessen an der Anzahl der täglich gerauchten Zigaretten am Ende des Experiments), während die unabhängige Variable der Behandlungstyp war, wobei es zwei unabhängige Gruppen (die Behandlungsgruppe und Kontrollgruppe) gab. Ein unabhängiger t-Test wurde verwendet, um zu bestimmen, ob es einen statistisch signifikanten Unterschied im Zigarettenkonsum zwischen den beiden unabhängigen Gruppen (d. h. der Behandlungsgruppe und der Kontrollgruppe) gab. Setup in Stata In Stata haben wir die beiden Gruppen für die Analyse getrennt, indem wir eine Gruppierungsvariable namens TreatmentType erstellen. Und erhielt die Kontrollgruppe, die das Placebo erhielt, einen Wert von 1 - Placebo und die Behandlungsgruppe, die die Nikotinpflaster im Wert von 2 - Nicotinpflaster erhielten, wie unten gezeigt. Veröffentlicht mit schriftlicher Genehmigung von StataCorp LP. Die Scores für die abhängige Variable, CigaretteConsumption. Wurden dann in die Spalte rechts neben der unabhängigen Variablen TreatmentType in die Dateneditor-Tabelle (Bearbeiten) eingetragen. Wie unten gezeigt: Mit schriftlicher Genehmigung von StataCorp LP veröffentlicht. Testverfahren in Stata In diesem Abschnitt zeigen wir Ihnen, wie Sie Ihre Daten mit einem unabhängigen t-Test in Stata analysieren, wenn die sechs Annahmen im vorherigen Abschnitt, Annahmen. Nicht verletzt wurden. Sie können einen unabhängigen t-Test mit Code oder grafische Benutzeroberfläche (GUI) durchführen. Nachdem Sie Ihre Analyse durchgeführt haben, zeigen wir Ihnen, wie Sie Ihre Ergebnisse interpretieren können. Wählen Sie zuerst aus, ob Sie den Code oder die grafische Benutzeroberfläche (GUI) verwenden möchten. Der Code zum Ausführen eines unabhängigen t-Tests für Ihre Daten erfolgt wie folgt: ttest DependentVariable, by (IndependentVariable) Erscheint mit schriftlicher Genehmigung von StataCorp LP. Mit unserem Beispiel, wo die abhängige Variable ist CigaretteConsumption und die unabhängige Variable ist TreatmentType. Der erforderliche Code wäre: ttest CigaretteConsumption, by (TreatmentType) Anmerkung 1: Sie müssen präzise sein, wenn Sie den Code in das Feld eingeben. Der Code ist case sensitive. Wenn Sie z. B. cigaretteConsumption eingegeben haben, wobei das erste c kleiner als Großbuchstaben (dh ein großes C) ist, sollten Sie eine Fehlermeldung wie die folgende erhalten: Anmerkung 2: Wenn Sie immer noch die Fehlermeldung in Hinweis erhalten 1: oben lohnt es sich, den Namen zu überprüfen, den Sie bei der Einrichtung Ihrer Datei (siehe oben im Data Editor) Ihre abhängigen und unabhängigen Variablen im Data Editor angegeben haben. In dem Feld auf der rechten Seite des Dateneditor-Bildschirms ist es so, dass Sie Ihre Variablen im Abschnitt buchstabieren, nicht den Abschnitt, den Sie in den Code eingeben müssen (siehe unten für unsere unabhängige Variable). Dies mag offensichtlich sein, aber es ist ein Fehler, der manchmal gemacht wird, was zu dem Fehler in Anmerkung 1 oben führt. Geben Sie daher den Code ein, ttest CigaretteConsumption, nach (TreatmentType). Und drücken Sie die ReturnEnter-Taste auf Ihrer Tastatur. Veröffentlicht mit schriftlicher Genehmigung von StataCorp LP. Sie können die Stata-Ausgabe sehen, die hier erzeugt wird. Grafische Benutzeroberfläche (GUI) Die drei Schritte, die erforderlich sind, um einen unabhängigen t-Test im Stata 12 ndash, bekannt als ein Zwei-Gruppen-Mittelvergleichstest im Stata 12 ndash, zu sehen, sind unten gezeigt. Das gleiche Verfahren erfordert vier Stufen in Stata 13 und dies wird weiter unten gezeigt: Version 12 In Stata 12 klicken Sie auf Statistik gt Zusammenfassungen, Tabellen und Tests gt Klassische Prüfungen von Hypothesen gt Zwei-Gruppen-Mittelvergleichstest im obersten Menü, as Unten gezeigt. Veröffentlicht mit schriftlicher Genehmigung von StataCorp LP. Sie erhalten die ttest - Zweigruppen-Vergleichstest-Dialogbox: Veröffentlicht mit schriftlicher Genehmigung von StataCorp LP. Wählen Sie die abhängige Variable, CigaretteConsumption. Aus dem Dropdown-Feld Variablenname und der unabhängigen Variablen TreatmentType. Aus dem Dropdown-Feld "group variable name: Dropdown", wie unten gezeigt: Veröffentlicht mit schriftlicher Genehmigung von StataCorp LP. Version 13 Klicken Sie in Stata 13 auf Statistik gt Zusammenfassungen, Tabellen und Tests gt Klassische Tests von Hypothesen gt t Test (Mittelvergleichstest) im oberen Menü, wie unten gezeigt. Veröffentlicht mit schriftlicher Genehmigung von StataCorp LP. Sie werden mit dem t-Test (Vergleichstest-Dialog) präsentiert: Veröffentlicht mit schriftlicher Genehmigung von StataCorp LP. Wählen Sie im Bereich ndasht-testsndashash die Option Zwei Beispiele mit Gruppen aus, wie unten gezeigt: Veröffentlicht mit schriftlicher Genehmigung von StataCorp LP. Wählen Sie die abhängige Variable, CigaretteConsumption. Aus dem Dropdown-Feld Variablenname und der unabhängigen Variablen TreatmentType. Aus dem Dropdown-Feld "Gruppenname". Sie werden am Ende mit einem Bildschirm ähnlich dem folgenden: Veröffentlicht mit schriftlicher Genehmigung von StataCorp LP. Drück den Knopf. Die Ausgabe, die Stata erzeugt, wird unten gezeigt. Ausgabe des unabhängigen t-Tests in Stata Wenn Ihre Daten die Annahme 4 (dh keine signifikanten Ausreißer) bestanden haben, wurde die Annahme 5 (dh Ihre abhängige Variable war annähernd normalverteilt für jede Kategorie der unabhängigen Variablen) und die Annahme 6 (dh Homogenität von Varianzen), die wir bereits im Abschnitt Annahmen beschrieben haben, müssen Sie nur die folgende Stata-Ausgabe für den unabhängigen t-Test interpretieren: Mit schriftlicher Genehmigung von StataCorp LP veröffentlicht. Diese Ausgabe liefert nützliche deskriptive Statistiken für die beiden Gruppen, die Sie verglichen haben, einschließlich der Mittelwert - und Standardabweichung sowie die tatsächlichen Ergebnisse des unabhängigen t-Tests. Wir können sehen, daß die Gruppenmittel signifikant unterschiedlich sind, wenn der p-Wert in der Pr (Tt) - Reihe (unter Ha: diff & sub0;) kleiner als 0,05 ist (d. h. auf der Basis eines Signifikanzniveaus von zwei Signalen). Betrachtet man die mittlere Säule, können Sie sehen, dass die Menschen, die die Nikotinpflaster verwendet hatten einen niedrigeren Zigarettenkonsum am Ende des Experiments im Vergleich zu denen, die das Placebo erhielten, hatten. Hinweis: Wir präsentieren die Ausgabe des unabhängigen t-Tests oben. Da Sie jedoch Ihre Daten für die Annahmen getestet haben müssen, die wir bereits im Abschnitt "Annahmen" erläutert haben, müssen Sie auch die Stata-Ausgabe interpretieren, die beim Testen für sie erstellt wurde. Dazu gehören: a) die Kastenplots, mit denen Sie überprüft haben, ob es bedeutende Ausreißer gab; b) die Ausgangssituation für den Shapiro-Wilk-Test der Normalität zur Ermittlung der Normalität und (c) die Ausgangsleistung für den Levenes-Test zur Homogenität von Abweichungen. Denken Sie auch daran, dass die Ausgabe, die Sie von der unabhängigen t-Testprozedur (dh der Ausgabe, die wir oben besprochen haben) nicht mehr relevant ist, wenn Ihre Daten eine dieser Annahmen nicht bestanden haben, und Sie müssen die Stata-Ausgabe interpretieren Produziert, wenn sie scheitern (dh dies beinhaltet verschiedene Ergebnisse). Berichte über die Ausgabe des unabhängigen t-Tests Wenn Sie die Ausgabe Ihres unabhängigen t-Tests melden, ist es empfehlenswert, a) eine Einführung in die von Ihnen durchgeführte Analyse (b) Teilnehmer waren in jeder Gruppe Ihrer beiden Gruppen (NB ist besonders nützlich, wenn die Gruppengrößen ungleich waren oder wenn es fehlende Werte gab) (c) die mittlere und Standardabweichung für Ihre beiden unabhängigen Gruppen und (d) den beobachteten t-Wert (T), Freiheitsgrade (Freiheitsgrade) und Signifikanzniveau, genauer gesagt der 2-tailed-p-Wert (Pr (T t)). Basierend auf den obigen Ergebnissen konnten wir die Ergebnisse dieser Studie wie folgt berichten: Ein unabhängiger t-Test wurde mit einer Stichprobe von 30 starken Rauchern durchgeführt, um festzustellen, ob es Unterschiede im Zigarettenkonsum auf der Grundlage der Behandlungstypen, bestehend aus einem Placebo Die Kontrollgruppe) und Nikotinpflaster (die Behandlungsgruppe). Beide Gruppen bestanden aus 15 randomisierten Teilnehmern. Die Ergebnisse zeigten, dass die Teilnehmer Nikotinpflaster hatten am Ende des Experiments statistisch signifikant niedrigeren Zigarettenkonsum (21,47 177 2,07 Zigaretten), verglichen mit den Teilnehmern der Placebo (28,53 177 2,07 Zigaretten), t (28) 2,410, p 0,023. Zusätzlich zur Meldung der Ergebnisse wie oben kann ein Diagramm verwendet werden, um Ihre Ergebnisse visuell darzustellen. Beispielsweise können Sie dies mit Hilfe eines Balkendiagramms mit Fehlerbalken (z. B. bei denen die Fehlerbalken die Standardabweichung, Standardfehler oder 95 Konfidenzintervalle sein könnten). Dies kann es einfacher für andere, Ihre Ergebnisse zu verstehen. Darüber hinaus wird zunehmend erwartet, dass Sie zusätzlich zu Ihren unabhängigen T-Testergebnissen Effektgrößen berichten. Effektgrößen sind wichtig, da der unabhängige t-Test Ihnen sagt, ob der Unterschied zwischen Gruppenmitteln real ist (d. H. In der Population unterschiedlich), aber nicht die Größe der Differenz. Während Stata nicht produzieren diese Effektgrößen für Sie mit diesem Verfahren gibt es ein Verfahren in Stata, um Soparison von zwei Mitteln zu tun In vielen Fällen ist ein Forscher interessant in der Erhebung von Informationen über zwei Populationen, um sie zu vergleichen. Wie in der statistischen Schlussfolgerung für einen Populationsparameter sind Konfidenzintervalle und Tests von Signifikanz nützliche statistische Werkzeuge für die Differenz zwischen zwei Populationsparametern. Konfidenzintervall für den Unterschied zwischen zwei Mitteln Ein Konfidenzintervall für die Differenz zwischen zwei Mitteln gibt einen Wertebereich an, innerhalb dessen die Differenz zwischen den Mitteln der beiden Populationen liegen kann. Diese Intervalle können beispielsweise von einem Erzeuger berechnet werden, der die Differenz der mittleren Tagesleistung von zwei Maschinen, einem medizinischen Forscher, abschätzen möchte, der den Unterschied in der mittleren Antwort von Patienten schätzen möchte, die zwei verschiedene Medikamente usw. erhalten. Das Vertrauensintervall Denn die Differenz zwischen zwei Mitteln enthält alle Werte von (-) (die Differenz zwischen den beiden Populationsmitteln), die im zweiseitigen Hypothesentest von H 0 nicht zurückgewiesen würden. Gegen H a. . H. H & sub0 ;. - 0 gegen H a. - 0. Wenn das Konfidenzintervall 0 enthält, können wir sagen, dass es keinen signifikanten Unterschied zwischen den Mitteln der beiden Populationen bei einem gegebenen Vertrauensniveau gibt. (Definition von Valerie J. Easton und John H. McColls Statistik-Glossar v1.1) Tests von Signifikanz für zwei unbekannte Mittel und bekannte Standardabweichungen Gegebene Proben von zwei normalen Populationen der Größe n 1 und n 2 mit unbekannten Mitteln und bekanntem Standard Abweichungen und. Die Test-Statistik Vergleich der Mittel ist bekannt als die Zwei-Stichproben-z-Statistik Die Nullhypothese nimmt immer an, dass die Mittel gleich sind, während die alternative Hypothese einseitig oder zweiseitig sein kann. Tests der Signifikanz für zwei unbekannte Mittel und unbekannte Standardabweichungen Im allgemeinen sind die Populationsstandardabweichungen nicht bekannt und werden durch die berechneten Werte s 1 und s 2 geschätzt. In diesem Fall wird die Teststatistik durch die Zwei-Stichproben-t-Statistik definiert. Obwohl die Zwei-Stichproben-Statistik nicht exakt der t-Verteilung folgt (da zwei Standardabweichungen in der Statistik geschätzt werden), können konservative P-Werte unter Verwendung von erhalten werden T (k) - Verteilung, wobei k die kleinere von n 1 -1 und n 2 -1 darstellt. Eine weitere Möglichkeit ist die Schätzung der Freiheitsgrade über eine Berechnung aus den Daten, die die allgemeine Methode von statistischen Software wie MINITAB verwendet wird. Das Konfidenzintervall für die Mitteldifferenz ist gegeben durch: wobei t der obere (1 - C) 2 kritische Wert für die t-Verteilung mit k Freiheitsgraden ist (wobei k gleich dem kleineren von n 1 - 1 und n 1 ist -2 oder die berechneten Freiheitsgrade). Der Datensatz Normale Körpertemperatur, Geschlecht und Herzfrequenz enthält 130 Beobachtungen der Körpertemperatur zusammen mit dem Geschlecht der einzelnen Personen und ihrer Herzfrequenz. Im Datensatz gibt die erste Spalte die Körpertemperatur an, und die zweite Spalte gibt den Wert 1 (männlich) oder 2 (weiblich) an, um das Geschlecht eines jeden Subjekts zu beschreiben. Die Verwendung des Befehls MINITAB DESCRIBE mit dem Unterbefehl BY zur Trennung der beiden Geschlechter liefert die folgenden Informationen: Gibt es einen signifikanten Unterschied zwischen den mittleren Körpertemperaturen für Männer und Frauen, um H 0 zu testen. - 0 gegen H a. - 0, die Teststatistik (98.105 - 98.394) (sqrt (0,699sup265 0,743sup265)) -0.2890.127 -2.276 berechnen. Unter Verwendung der in Tabelle E in Moore und McCabe durch die t (60) - Verteilung geschätzten t (64) - Verteilung sehen wir, daß 2 P (t gt 2,276) zwischen 0,04 und 0,02 liegt, was einen signifikanten Unterschied zwischen den Mitteln bei 0,05 anzeigt (Jedoch nicht auf 0,01). Um ein Konfidenzintervall von 95 zu berechnen, stellen wir zunächst fest, dass der 0.025 kritische Wert t für die t (60) - Verteilung 2.000 ist, was das Intervall ((98.105 - 98.394) 2.0000.127) (-0.289 - 0.254, -0.289 0.254) ergibt ( -0,543, -0,045). Der Wert 0 ist nicht im Intervall enthalten, was wiederum eine signifikante Differenz auf dem 0,05-Niveau anzeigt. Die Durchführung dieses Tests in MINITAB unter Verwendung des TWOT-Befehls ergibt die Ergebnisse Obwohl die MINITAB-berechneten Freiheitsgrade (127) viel höher sind als die konservative Schätzung von 64, sehen wir, dass die Ergebnisse weitgehend gleich sind. Datenquelle: Daten in Mackowiak, P. A. Wasserman, S. S. und Levine, M. M. (1992), eine kritische Bewertung von 98,6 Grad F, die Obergrenze der normalen Körpertemperatur und andere Vermächtnisse von Carl Reinhold August Wunderlich, Journal of the American Medical Association. 268, 1578-1580. Datensatz verfügbar durch das JSE-Datensatzarchiv. Pooled t Verfahren Wenn es sinnvoll ist anzunehmen, dass zwei Populationen die gleiche Standardabweichung haben, kann anstelle der allgemeinen Zwei-Stichproben-t-Prozedur ein alternatives Verfahren verwendet werden, das als das gepoolte t-Verfahren bekannt ist. Da in diesem Fall nur eine Standardabweichung zu schätzen ist, folgt die resultierende Teststatistik genau einer t - Verteilung mit n 1 n 2 - 2 Freiheitsgraden. Die gepoolte Schätzung der Varianz wird in der gepoolten Zweistichprobe t-Statistik verwendet. Bei der obigen Körpertemperatur sind die Standardabweichungen für die männlichen und weiblichen Probanden hinreichend nahe. Die Verwendung des MINITAB-Unterbefehls POOLED mit dem zweistufigen t-Test ergibt die folgenden Ergebnisse: Die Testergebnisse waren in diesem Fall nahezu identisch.


No comments:

Post a Comment