HINWEIS: Die IDRE Statistische Beratungsgruppe wird die Website im Februar auf das WordPress CMS migrieren, um die Wartung und Erstellung neuer Inhalte zu erleichtern. Einige unserer älteren Seiten werden entfernt oder archiviert, so dass sie nicht mehr gepflegt werden. Wir werden versuchen, Umleitungen zu pflegen, damit die alten URLs weiterhin so gut funktionieren wie möglich. Willkommen beim Institut für digitale Forschung und Bildung Hilfe der Stat Consulting Group durch ein Geschenk Stata Class Notes Zählen von n bis N Einleitung Stata hat zwei eingebaute Variablen namens n und N. N ist Stata-Notation für die aktuelle Beobachtungsnummer. N ist 1 in der ersten Beobachtung, 2 in der zweiten, 3 in der dritten, und so weiter. N ist Stata-Notation für die Gesamtzahl der Beobachtungen. Lets sehen, wie n und N arbeiten. Wie Sie sehen können, enthält die Variable id die Beobachtungsnummer, die von 1 bis 7 läuft, und nt ist die Gesamtzahl der Beobachtungen, die 7 ist. Zählen mit unter Verwendung von n und N in Verbindung mit dem Befehl by kann einige sehr nützliche Ergebnisse erzeugen. Natürlich, um den Befehl zu verwenden, müssen wir zuerst unsere Daten auf der Variablen sortieren. Nun ist n1 die Beobachtungsnummer innerhalb jeder Gruppe und n2 ist die Gesamtzahl der Beobachtungen für jede Gruppe. Um die niedrigste Punktzahl für jede Gruppe aufzulisten, verwenden Sie die folgenden Punkte: Um die höchste Punktzahl für jede Gruppe aufzulisten, verwenden Sie die folgenden: Eine andere Verwendung von n Lets verwenden n, um herauszufinden, ob es doppelte ID-Nummern in den folgenden Daten gibt: Wie sich herausstellt, Beobachtungen 6 und 7 haben die gleichen ID-Nummern und aber unterschiedliche Notenwerte. Duplikate finden Jetzt können wir N verwenden, um doppelte Beobachtungen zu finden. In diesem Beispiel sortieren wir die Beobachtungen durch alle Variablen. Dann verwenden wir alle Variablen in der by-Anweisung und setzen gesetzt n gleich der Gesamtzahl der identifizierenden Beobachtungen. Schließlich listen wir die Beobachtungen auf, für die N größer als 1 ist, wodurch die doppelten Beobachtungen identifiziert werden. Wenn Sie eine Menge von Variablen in der Datenmenge haben, könnte es eine lange Zeit dauern, um sie alle zweimal einzugeben. Wir können die Wildcard nutzen, um anzuzeigen, dass wir alle Variablen verwenden möchten. Weiter in den neuesten Versionen von Stata können wir sortieren und in eine einzige Aussage kombinieren. Unten ist eine vereinfachte Version des Codes, die genau die gleichen Ergebnisse wie oben liefert. Der Inhalt dieser Website sollte nicht als eine Bestätigung einer bestimmten Website, Buch oder Software-Produkt von der University of California ausgelegt werden. Für schnelle Fragen E-Mail dataprinceton. edu. Keine appts Notwendig während der begehbaren Stunden. Hinweis: Das DSS-Labor ist geöffnet, solange Firestone offen ist, keine Termine, die für die Verwendung der Laborcomputer für Ihre eigene Analyse erforderlich sind. Zeitreihen-Daten in Stata Zeitreihen-Daten und tsset Um Statas-Zeitreihen-Funktionen und - Analysen zu verwenden, müssen Sie zunächst sicherstellen, dass Ihre Daten in der Tat Zeitreihen sind. Zuerst müssen Sie eine Datumsvariable haben, die im Stata-Datumsformat vorliegt. Zweitens müssen Sie sicherstellen, dass Ihre Daten nach dieser Datumsvariable sortiert werden. Wenn Sie Panel-Daten haben, dann müssen Ihre Daten nach der Variablen Variable innerhalb der Variablen sortiert werden, die das Panel identifiziert. Schließlich müssen Sie den Befehl tsset verwenden, um Stata mitzuteilen, dass Ihre Daten Zeitreihen sind: Das erste Beispiel teilt Stata mit, dass Sie einfache Zeitreihendaten haben und die zweite sagt Stata, dass Sie Panel-Daten haben. Stata Datumsformat Stata speichert Daten als Anzahl der verstrichenen Tage seit dem 1. Januar 1960. Es gibt verschiedene Möglichkeiten, um verstrichene Stata-Daten zu erstellen, die davon abhängen, wie die Daten in Ihren Daten dargestellt werden. Wenn Ihr ursprünglicher Datensatz bereits eine einzelne Datumsvariable enthält, verwenden Sie die Funktion date () oder einen der anderen String-date-Befehle. Wenn Sie getrennte Variablen haben, die verschiedene Teile des Datums (Monat, Tag und Jahr Jahr und Quartal usw.) speichern, müssen Sie die partiellen Datumsvariablenfunktionen verwenden. Datumsfunktionen für eine einzelne String-Datumsvariable Manchmal haben Ihre Daten die Daten im String-Format. (Eine String-Variable ist einfach eine Variable mit etwas anderem als nur Zahlen.) Stata bietet eine Möglichkeit, diese in Zeitreihen-Daten umzuwandeln. Das erste, was Sie wissen müssen, ist, dass die Saite leicht in ihre Komponenten getrennt werden muss. Mit anderen Worten, Strings wie 01feb1990 1. Februar 1990 020190 sind akzeptabel, aber 020190 ist nicht. Zum Beispiel können wir sagen, dass Sie eine String-Variable sdate mit Werten wie 01feb1990 haben und Sie müssen es in ein tägliches Zeitreihen-Datum umwandeln: Beachten Sie, dass in dieser Funktion, wie bei den anderen Funktionen, um Strings in Zeitreihen-Daten umzuwandeln, Der DMY-Teil gibt die Reihenfolge des Tages, des Monats und des Jahres in der Variablen an. Wurden die Werte am 1. Februar 1990 codiert, hätten wir stattdessen MDY verwendet. Was passiert, wenn das ursprüngliche Datum nur zwei Ziffern für das Jahr hat Dann würden wir verwenden: Wann immer du zweistellige Jahre hast, lege einfach das Jahrhundert vor dem Y. Wenn du die letzten zweistelligen Jahre gemischt hast, wie zB 1298 und 1200, benutze: Wo 2020 das größte Jahr ist, das du in deinem Datensatz hast. Hier sind die anderen Funktionen: wöchentlich (stringvar, wy) monatlich (stringvar, my) vierteljährlich (stringvar, qy) halbjährlich (stringvar, hy) jährlich (stringvar, y) Anmerkung: Stata 10 verwendet Großbuchstaben als DMY, während frühere Version von Stata verwendet Kleinbuchstaben, dmy. Date-Funktionen für partielle Datumsvariablen Oft haben Sie separate Variablen für die verschiedenen Komponenten des Datums, das Sie benötigen, um sie zusammenzustellen, bevor Sie sie als richtige Zeitreihen-Datumsangaben benennen können. Stata bietet eine einfache Möglichkeit, dies mit numerischen Variablen zu tun. Wenn Sie für Monat, Tag und Jahr separate Variablen haben, verwenden Sie die mdy () - Funktion, um eine verstrichene Datumsvariable zu erstellen. Sobald Sie eine verstrichene Datumsvariable erstellt haben, werden Sie sie wahrscheinlich wie folgt formatieren möchten. Verwenden Sie die Funktion mdy (), um eine verstrichene Stata-Datumsvariable zu erstellen, wenn Ihre ursprünglichen Daten separate Variablen für Monat, Tag und Jahr enthalten. Die Variablen des Monats, des Tages und des Jahres müssen numerisch sein. Angenommen, Sie arbeiten mit diesen Daten: Konvertieren einer als Variable gespeicherten Datumsvariablen Wenn Sie eine Datumsvariable haben, in der das Datum als einzelne Nummer des Formulars yyyymmdd gespeichert ist (z. B. 20041231 für den 31. Dezember 2004) Der folgende Satz von Funktionen wird es in ein Stata verstrichenen Datum umwandeln. Gen Jahr int (Datum10000) Gen Monat int ((Datum-Jahr10000) 100) Gen Tag int ((Datum-Jahr10000-Monat100)) Gen mydate mdy (Monat, Tag, Jahr) Format mydate d Zeitreihen-Datumsformate Verwenden Sie den Format-Befehl Um verstrichene Stata-Daten als Kalendertermine anzuzeigen. In dem oben angegebenen Beispiel hat die verstrichene Datumsvariable mydate die folgenden Werte, die die Anzahl der Tage vor oder nach dem 1. Januar 1960 darstellen. Weitere Informationen finden Sie im Stata-Benutzerhandbuch, Kapitel 27. Festlegung von Daten Oft müssen wir Konsultieren Sie eine bestimmte Analyse nur auf Beobachtungen, die auf einen bestimmten Zeitpunkt fallen. Um dies zu tun, müssen wir etwas wie ein Datum wörtlich verwenden. Ein Datum Literal ist einfach eine Möglichkeit, ein Datum in Worte eingeben und haben Stata automatisch umwandeln sie in ein verstrichenes Datum. Wie bei dem d () Literal, um ein reguläres Datum anzugeben, gibt es die w (), m (), q (), h () und y () Literale für die Eingabe wöchentlich, monatlich, vierteljährlich, halbjährlich und Jährliche Termine. Hier sind einige Beispiele: Wenn Sie einen Bereich von Daten angeben möchten, können Sie die Funktionen tin () und twithin () verwenden: Der Unterschied zwischen tin () und twithin () ist, dass tin () das Anfangs - und Enddatum enthält, Während twithin () sie ausschließt. Geben Sie immer zuerst den Anfangszeitpunkt ein und schreiben Sie sie wie bei den Funktionen d (), w (), etc.. Zeitreihenvariablenlisten Oftmals in Zeitreihenanalysen müssen wir die Werte einer Variablen von einer Beobachtung zum nächsten verzögern oder führen. Wenn wir viele Variablen haben, kann dies schwerfällig sein, besonders wenn wir eine Variable mehr als einmal hinterlassen müssen. In Stata können wir festlegen, welche Variablen verzögert werden sollen und wie oft, ohne neue Variablen zu erstellen und damit viel Speicherplatz und Speicher zu sparen. Sie sollten beachten, dass der Befehl tsset ausgegeben werden muss, bevor einer der Tricks in diesem Abschnitt funktioniert. Auch wenn Sie Ihre Daten als Panel-Daten definiert haben, wird Stata automatisch die Berechnungen neu starten, wie es zum Anfang eines Panels kommt, so dass Sie sich keine Sorgen um Werte von einem Panel machen müssen, das auf das nächste übertragen wird. L. varname und F. varname Wenn du eine Variable für eine Analyse verzögern oder führen musst, kannst du dies mit dem L. varname (to lag) und F. varname (to lead) machen. Beide arbeiten auf die gleiche Weise, so gut nur zeigen einige Beispiele mit L. varname. Lets sagen, Sie wollen dieses Jahr Einkommen aus dem letzten Jahr Einkommen: würde dies zu erreichen. Die L. erzählt Stata, um Einkommen um einen Zeitraum zu verzögern. Wenn du mehr als eine Zeitspanne einkommen willst, würdest du einfach das L. zu etwas wie L2 wechseln. Oder L3. Um es um 2 und 3 Zeiträume zu behalten. Die folgenden zwei Befehle werden die gleichen Ergebnisse erzielen: Eine andere nützliche Verknüpfung ist D. varname, die den Unterschied des Einkommens in der Zeit 1 und Einkommen in der Zeit 2 nimmt. Zum Beispiel sagen wir, dass eine Person 20 gestern und 30 heute verdient hat.
No comments:
Post a Comment