Ich laufe eine schrittweise binäre logit Regression in Stata mit 14 unabhängigen Variablen. Zwei der unabhängigen Variablen sind Dummies (vorausgesetzt, ein Wert von 0 oder 1). Ive getestet die unabhängigen Variablen für multicollinearity und angepasst sie durch die Standardisierung oder Verwendung der natürlichen Logarithmus ihrer Werte, um dieses Problem zu mildern (VIFlt2.5). Das normale Modell läuft jedoch reibungslos, wenn ich bootstrap die Probe (von Beobachtungen: 73) mit 1000 Replikationen Ich empfange p-Werte von 1,0000. Darüber hinaus schließen die Ergebnisse mit der Anmerkung: ein oder mehrere Parameter konnten nicht in 314 Bootstrap-Replikationen abgeschätzt werden. Standard-Fehler-Schätzungen beinhalten nur vollständige Replikationen. Zwei Fragen: 1. Ist die VIF-Schwelle, die ich richtig verwendet (VIFlt2.5) Welche anderen Möglichkeiten gibt es loszuwerden, multicollinearity, ohne fallen eine der Variablen 2. Da ich nicht davon ausgehen, dass Multikollinearität ist ein Problem mehr, was sonst Könnte ich getan haben, falsch in Bezug auf meine bootstraping Methodik Vielen Dank im Voraus für Ihre Antwort (en) Ihr Ansatz ist nicht ehrlich über die Anzahl der Parameter geschätzt. Der Transformationsschätzprozess muss Teil des Bootstrap sein, wie jeder andere Modellierungsschritt, der Y verwendet. Collinearity auf dem anderen Handle, kann oft ignorieren Y und kann mit Pre-Outcome-Modellierung behandelt werden. Es gibt keine Notwendigkeit, P-Werte mit dem Bootstrap zu berechnen, wie Sie bereits diejenigen aus dem ursprünglichen Modell passen. Ndash Frank Harrell 13 Mai at 12:43 Frank, vielen Dank für Ihre schnelle Antwort. Um es in die Worte eines Laien: Das bedeutet, dass ich nicht brauchen, um bootstrap meine Probe Isn39t die ursprüngliche Stichprobengröße von 73 zu klein, um entsprechende Ergebnisse zu erhalten Darüber hinaus, was meinst du mit quotnot honestquot Dass die Transformationen, die ich gewählt habe, nicht sind In Übereinstimmung mit einander Leider ist die Frage der Multikollinearität, wenn ich einen konsistenten Ansatz verwenden. Ndash Tim May 13 14 am 13:04 Sie schätzen effektiv einige mehr Parameter, wenn Sie verschiedene Umwandlungen versuchen. Sie müssen die Bootstrap von Grund auf neu alle Modellierungsschritte jedes Mal, einschließlich der Prüfung Transformationen zu wiederholen. Dies ist, warum gerade passende Regression Splines, wenn oft ein großer Ansatz. Der Bootstrap setzt die Regressions-Splines für jedes Re-Sample um. Ndash Frank Harrell May 13 14 um 16: 26NOTICE: Die IDRE Statistical Consulting Group wird die Migration der Website auf die WordPress CMS im Februar zu erleichtern Wartung und Erstellung neuer Inhalte. Einige unserer älteren Seiten werden entfernt oder archiviert, so dass sie nicht länger erhalten bleiben. Wir werden versuchen, Redirects beizubehalten, damit die alten URLs weiterhin so gut funktionieren, wie wir können. Willkommen im Institut für digitale Forschung und Bildung Helfen Sie der Stat Consulting Group, indem Sie ein Geschenk geben Stata Lehrbuch Beispiele Applied Regression Analyse von John Fox Kapitel 16: Bewertung der Stichprobenvariante: Bootstrapping und Cross-Validation Das erste Beispiel ist der Einkommen von vier Ehepaaren aus Tabelle 16.1. Zuerst erstellen wir einen Datensatz aus vier Variablen mit 256 Beobachtungen der Tabelle 16.2 mit dem Befehl cross. Dann verwenden wir den Befehl egen, um eine Variable mit dem Mittelwert über jede Zeile zu generieren. Abbildung 16.1, Seite 498. Das zweite Beispiel von 10 verheirateten Paaren basiert auf Tabelle 16.3, Seite 499. Zuerst erstellen wir einen Datensatz, der auf Tabelle 16.3 basiert. Dann führen wir Stata bootstrapping Befehl bootstrap, um bootstrap Schätzung unserer Statistik zu erhalten. Wir speichern das Ergebnis in einer Datendatei namens bmean. Dann verwenden wir bmean, um das Frequenzdiagramm zu graphisieren (Abbildung 16.2). Bootstrapping-Regression mit der Datendatei duncan. Die folgenden Ergebnisse unterscheiden sich von Tabelle 16.5, da das robuste Regressionsverfahren bei Stata von Huber zu Bigewicht während der Berechnung wechselt. Abbildung 16.3 (a), Seite 508. Konfidenzintervall, das verwendet wird, wenn die Perzentilschätzungen basieren. Der Inhalt dieser Website sollte nicht als eine Bestätigung für eine bestimmte Website, ein Buch oder ein Softwareprodukt der Universität von Kalifornien verstanden werden.
No comments:
Post a Comment