Titelaufnahme

Titel
Evaluation of statistical matching and selected SAE methods using Micro Census and EU-SILC data / von Verena Puchner
VerfasserPuchner, Verena
Begutachter / BegutachterinTempl, Matthias
Erschienen2013
UmfangVII, 99 S. : graph. Darst.
HochschulschriftWien, Techn. Univ., Dipl.-Arb., 2013
SpracheEnglisch
DokumenttypDiplomarbeit
URNurn:nbn:at:at-ubtuw:1-65744 Persistent Identifier (URN)
Zugriffsbeschränkung
 Das Werk ist frei verfügbar
Dateien
Evaluation of statistical matching and selected SAE methods using Micro Census and EU-SILC data [1.35 mb]
Links
Nachweis
Klassifikation
Zusammenfassung (Deutsch)

Aufgrund der Tatsache, dass Armutsschätzungen auf regionaler Ebene auf Basis des EU-SILC Samples nicht von ausreichender Genauigkeit ist, sollte die Qualität der Schätzungen verbessert werden, indem die Mikrozensus Stichprobe für die Schätzung mit einbezogen wird. Im Vergleich zu EU-SILC bestehen die Mikrozensus Umfragedaten aus mehr Beobachtungen. Durch die größere Stichprobe des Mikrozensus wird für die Armutsschätzung eine kleinere Varianz erwartet. Allerdings wird das Einkommen im Mikrozensus nicht erhoben, dies ist aber notwendig um Armut zu schätzen. Das Ziel ist es, die "besten" Methoden zur Schätzung von Armut in Bezug auf kleine Verzerrung und kleiner Varianz zu finden. Um die "wahren" Parameterwerte zu kennen, ist es notwendig, eine künstliche realitätsnahe Grundgesamtheit der Bevölkerung zu erzeugen. Um die Qualität von den Methoden zu beurteilen, werden aus der Population unter Berücksichtigung des jeweiligen Stichprobendesigns wiederholt EU-SILC und Mikrozensus Stichproben gezogen. Variablen aus EU-SILC werden mit dem Mikrozensus mit Hilfe von Methoden der Small Area Estimation und des Statistischen Matchings zusammengeführt. Armutsindikatoren werden nun aus dem erweiterten Mikrozensus geschätzt und mit den "wahren" Werten der Population verglichen. Der Bias und die Varianz der direkten Schätzung und den verschiedenen Methoden werden ausgewertet und verglichen. Bezüglich der Varianz schneiden die Methoden des Statistischen Matchings besser ab als die untersuchten Regressionsmethoden. Umgekehrt verhält es sich in Bezug auf den Bias. Der durchschnittliche mittlere quadratische Fehler auf regionaler Ebene ist bei der direkten Schätzung im Allgemeinen am Besten, gefolgt von den logistischen Regressionsmethoden und den Methoden des Statistischen Matchings.

Zusammenfassung (Englisch)

Due to the fact that poverty estimations on regional level on basis of EU-SILC samples is not of adequate accuracy, the quality of the estimations should be improved by additionally incorporating Micro Census data for estimation. In comparison to EU-SILC, the Micro Census survey data consists of more observations. However, income is not questionaired but necessary to estimate poverty. The aim is to find the "best" method for the estimation of poverty in terms of small bias and small variance. Therefor an artificial "close-to-reality" population is simulated in order to know the "true" parameter values. To make an assessment of the quality, considering the respective sample designs, EU-SILC and Micro Census samples are drawn repeatedly. Variables of interest are imputed into the Micro Census data sets with the help of the EU-SILC samples through regression models including selected unit-level small area methods and statistical matching methods and poverty indicators are estimated in the following. The bias and variance for the direct estimator and the several methods are evaluated and compared. The variance is desired to be reduced by the larger sample size of the Micro Census. In conclusion, the result is that it doesn't exist only one method performing by far best in terms of bias and variance among the used models. Concerning the bias, most often the statistical matching methods perform better than the regression methods, but regarding the variances, the regression models do a better job in general. In terms of the average mean squared error of states the direct estimator performs best, followed by logistic (mixed) regression models and all the statistical matching methods.