Die Biografiedaten ausgewählter Sozialversicherungsträger in Deutschland (BASiD) sind eine 1%-Stichprobe aus der Grundgesamtheit der Versicherten der Deutschen Rentenversicherung Bund, angelegt nach der Versichertenkontenstichprobe (VSKT) 2007. Die VSKT besteht aus der Gesamtheit der Personen, die im Beobachtungszeitraum mindestens einmal einen der folgenden Erwerbsstatus aufweisen: Sozialversicherungspflichtige Beschäftigung (erfasst ab 1951), Geringfügige Beschäftigung (erfasst ab 1999), Selbstständigkeit bei freiwilliger Versicherung in der gesetzlichen Rentenversicherung, Bezug von Leistungen nach dem Rechtskreis SGB III (erfasst ab 1951) oder SGB II (erfasst ab 2005).
Die aus der VSKT stammenden Versichertenkonten werden in den IEB ermittelt und mit der VSKT zusammengeführt, so dass zusätzlich Informationen zu den Personen erfasst werden, wenn diese Bei der Bundesagentur für Arbeit (BA) als arbeitsuchend gemeldet (erfasst ab 2000) waren oder eine (geplante) Teilnahme an arbeitsmarktpolitischer Maßnahme (erfasst ab 2000) stattgefunden hat.
Eine Übersicht der zentralen Merkmale der schwach anonymisierten Version bietet die Kurzbeschreibung (pdf).
Unterschiede zwischen den Versionen
- Schwach anonymisierte Version (BASiD 5109)
- Faktisch anonymisierte Version
Die faktisch anonymisierte Version stammt nicht aus demselben Datenaufbereitungsverfahren wie die schwach anonymisierte Version. Die zentralen Unterschiede zwischen beiden Versionen der BASiD Datensätzen sind deren Anonymisierungsgrad und Variablenumfang. Die faktisch anonymisierte Version enthält Merkmale, die im Vergleich zur schwach anonymisierten Version nur in vergröberter Form enthalten sind (z.B. Region, Berufsklassifikation, Wirtschaftszweig). Zudem ist das Datenformat unterschiedlich. Während die schwach anonymisierte Form im long Format gehalten ist, liegt die faktisch anonymisierte Version im wide Format vor.
Die schwach anonymisierte Version kann nur im Rahmen von Gastaufenthalten inklusive Datenfernverarbeitung genutzt werden. Die faktisch anonymisierte Version wird den beantragenden Forschungseinrichtungen über das Forschungsdatenzentrum der Deutschen Rentenversicherung als Scientific Use File (SUF) zum Download zur Verfügung gestellt.
Datensatzbeschreibungen und Auszählungen
Version | FDZ-Datenreport | Auszählungen und Labels |
---|---|---|
Schwach anonymisierte Version BASiD 5109 |
Forschungsarbeiten mit BASiD
Datenzugang
Je nach Version stehen unterschiedliche Datenzugangswege zur Verfügung:
Schwach anonymisierten Version
Gastaufenthalt inklusive Datenfernverarbeitung. Weitere Informationen zur Beantragung eines Gastaufenthalts.
Faktisch anonymisierte Version
Die faktisch anonymisierte Version der BASiD Daten ist ausschließlich über das Forschungsdatenzentrum der Deutschen Rentenversicherung ab Ende Januar 2012 erhältlich.
Testdaten für die schwach anonymisierte Version
Um fehlerfreie Programme für die Datenfernverarbeitung und zur Vorbereitung von Gastaufenthalten schreiben zu können, stehen den Nutzerinnen und Nutzern Testdaten für Stata zur Verfügung:
Testdaten für Stata (zip, 36 MB)
Mit den Testdaten sind keine inhaltlichen Auswertungen möglich!
Weitere Arbeitshilfen
Eine kurze englische Beschreibung finden Sie in: Hochfellner, Daniela; Müller, Dana; Wurdack, Anja (2012): Biographical Data of Social Insurance Agencies in Germany – Improving the Content of Administrative Data. In: Schmollers Jahrbuch 132 (2012), 443 – 451
Weitere Arbeitshilfen wie Informationen zu den angebotenen Klassifikationen der Wirtschaftszweige, eine Übersicht der Beitragsbemessungs- und Geringfügigkeitsgrenzen, sowie Publikationen zur Arbeit mit den FDZ-Daten finden Sie unter Zentrale Arbeitshilfen.
Fehlerkorrektur
Es wurde ein Fehler in den Labels der Variable „estatvor“ (Beschäftigungsstatus vor Arbeitssuche) entdeckt. Weitere Informationen und Hinweise zur Korrektur des Fehlers finden Sie auf folgendem Infoblatt (pdf).