Institut für Arbeitsmarkt- und Berufsforschung

Navigation zu den wichtigsten Bereichen.

Inhaltsbereich: Institut für Arbeitsmarkt- und Berufsforschung

Biografiedaten ausgewählter Sozialversicherungsträger in Deutschland (BASiD)

Die Biografiedaten ausgewählter Sozialversicherungsträger in Deutschland (BASiD) sind eine 1%-Stichprobe aus der Grundgesamtheit der Versicherten der Deutschen Rentenversicherung Bund, angelegt nach der Versichertenkontenstichprobe (VSKT) 2007. Die VSKT besteht aus der Gesamtheit der Personen, die im Beobachtungszeitraum mindestens einmal einen der folgenden Erwerbsstatus aufweisen: Sozialversicherungspflichtige Beschäftigung (erfasst ab 1951), Geringfügige Beschäftigung (erfasst ab 1999), Selbstständigkeit bei freiwilliger Versicherung in der gesetzlichen Rentenversicherung, Bezug von Leistungen nach dem Rechtskreis SGB III (erfasst ab 1951) oder SGB II (erfasst ab 2005).

Die aus der VSKT stammenden Versichertenkonten werden in den IEB ermittelt und mit der VSKT zusammengeführt, so dass zusätzlich Informationen zu den Personen erfasst werden, wenn diese Bei der Bundesagentur für Arbeit (BA) als arbeitsuchend gemeldet (erfasst ab 2000) waren oder eine (geplante) Teilnahme an arbeitsmarktpolitischer Maßnahme (erfasst ab 2000) stattgefunden hat.

Eine Übersicht der zentralen Merkmale der schwach anonymisierten Version bietet die Kurzbeschreibung.

Unterschiede zwischen den Versionen

  • Schwach anonymisierte Version (BASiD 5109)
  • Faktisch anonymisierte Version

Die faktisch anonymisierte Version stammt nicht aus demselben Datenaufbereitungsverfahren wie die schwach anonymisierte Version. Die zentralen Unterschiede zwischen beiden Versionen der BASiD Datensätzen sind deren Anonymisierungsgrad und Variablenumfang. Die faktisch anonymisierte Version enthält Merkmale, die im Vergleich zur schwach anonymisierten Version nur in vergröberter Form enthalten sind (z.B. Region, Berufsklassifikation, Wirtschaftszweig). Zudem ist das Datenformat unterschiedlich. Während die schwach anonymisierte Form im long Format gehalten ist, liegt die faktisch anonymisierte Version im wide Format vor.

Die schwach anonymisierte Version kann nur im Rahmen von Gastaufenthalten inklusive Datenfernverarbeitung genutzt werden. Die faktisch anonymisierte Version wird den beantragenden Forschungseinrichtungen über das Forschungsdatenzentrum der Deutschen Rentenversicherung ab Ende Januar 2012 als Scientific Use File (SUF) zum Download zur Verfügung gestellt.

Datensatzbeschreibungen und Auszählungen

 Version      

 FDZ-Datenreport   

 Auszählungen und Labels   

Schwach anonymisierte Version
BASiD 5109

 FDZ-Datenreport 09/2011 (de)
 FDZ-Datenreport 09/2011 (en)

 Auszählungen und Labels (de)
 Frequencies and labels (en)

Datenzugang

Je nach Version stehen unterschiedliche Datenzugangswege zur Verfügung:

Schwach anonymisierten Version
 Faktisch anonymisierte Version
  • Die faktisch anonymisierte Version der BASiD Daten ist ausschließlich über das Forschungsdatenzentrum der Deutschen Rentenversicherung ab Ende Januar 2012 erhältlich.

Testdaten für die schwach anonymisierte Version

Um fehlerfreie Programme für die Datenfernverarbeitung und zur Vorbereitung von Gastaufenthalten schreiben zu können, stehen den Nutzerinnen und Nutzern Testdaten für Stata zur Verfügung:

Testdaten für Stata (36 MB)

MIT DEN TESTDATEN SIND KEINE INHALTLICHEN AUSWERTUNGEN MÖGLICH!

Weitere Arbeitshilfen

Eine kurze englische Beschreibung finden Sie in: Hochfellner, Daniela; Müller, Dana; Wurdack, Anja (2012): Biographical Data of Social Insurance Agencies in Germany – Improving the Content of Administrative Data. In: Schmollers Jahrbuch 132 (2012), 443 – 451

Weitere Arbeitshilfen wie Informationen zu den angebotenen Klassifikationen der Wirtschaftszweige, eine Übersicht der Beitragsbemessungs- und Geringfügigkeitsgrenzen, sowie Publikationen zur Arbeit mit den FDZ-Daten finden Sie hier.

 

 

Infobereich.

Abspann.