Combined Stochastic and Rule-based Approach to Improve Regression Models with Mismeasured Monotonic Covariates Without Side Information
ZEW Discussion Paper Nr. 11-013 // 2011Die Bildungsvariable in den IAB Datensätzen enthält viele fehlende und fehlerhafte Angaben. Diese Datenfehler stehen in Abhängigkeit zu anderen Variablen in den Datensätzen. Diese Datenproblematik hat über die Zeit an Quantität gewonnen. Dadurch können Analyseergebnisse, insbesondere auf Basis der letzten Jahre, stark verzerrt sein. Die Bildungsvariable stellt den höchsten bisher jemals erreichten formalen Bildungsabschluss einer Person dar. Unter Zuhilfenahme dieser Rahmenbedingungen wurden in der Literatur verschiedene Korrekturmöglichkeiten inkonsistenter Zeitreihen vorgeschlagen. Unter Verwendung dieser Korrekturregeln wird eine neue Methode entwickelt, um fehlklassifizierte Daten zu identifizieren und aus dem Datensatz zu entfernen. Ausgehend von einem erwartungsmaximierenden (EM) Schätzer für unvollständige Daten wird ein neuer Schätzer für diese Art der Datenkorrektur hergeleitet. Schätzer, welche mit dieser neuen Technik gewonnen werden, sind unverzerrt und konsistent unter der klassischen Annahme des bedingt-zufälligen Fehlens von Werten (MAR). Dieser neue Schätzer wird genutzt, um mit Hilfe getrennter Lohnregressionen nach Mincer für die Jahre 1993 bis 2003 Änderungen in den Lohnwirkungen der Bildungsabschlüsse zu messen. Die Ergebnisse zeigen, dass die Zahl der Bildungsjahre ein schlechter Proxy für die Messung von Bildungsrenditen ist, da es mehr auf die Qualität als auf die Quantität der Bildung ankommt. Zudem wird ein steigendes Lohndifferential zwischen den verschiedenen Bildungsabschlüssen gefunden. Damit wird die These unterstützt, dass die Bildungsexpansion dieser Dekade den Bedarf an hochqualifizierten Arbeitnehmern nicht überschritt und somit per se nicht von einer Bildungsinflation mit einer Abwertung der Bildungsabschlüsse gesprochen werden kann.
Dlugosz, Stephan (2011), Combined Stochastic and Rule-based Approach to Improve Regression Models with Mismeasured Monotonic Covariates Without Side Information, ZEW Discussion Paper Nr. 11-013, Mannheim.