http://id.insee.fr/qualite/attribut/2017/S.18.6/texte |
http://www.w3.org/1999/02/22-rdf-syntax-ns#value |
<p><strong>Enrichissement avec les données administratives</strong><br />
A la fin de la collecte, le fichier des répondants est enrichi d'informations provenant de la base << tous salariés >> issu principalement des sources administratives (DADS ou DSN). On récupère ainsi notamment l'activité de l'établissement, la profession du salarié, les éléments administratifs sur sa rémunération, le temps de travail rémunéré, etc. Cet enrichissement d'informations issues des sources administratives est central dans le processus de l'enquête, à la fois pour compléter les données d'enquête, mais aussi pour vérifier la cohérence entre information administrative et information issue de l'enquête et décider de redresser le cas échéant.<br />
<strong>Détermination du champ</strong><br />
La phase d'enrichissement sert aussi à repérer les cas << hors champ >>, afin de les différencier des non-répondants. On identifie les établissements hors champ (principalement ceux cessés depuis la constitution de la base de sondage) et les salariés hors champ (soit appartenant aux établissements hors champ, soit étant partis de l'établissement depuis la constitution de la base de sondage).<br />
<strong>Apurement et correction de la non-réponse</strong><br />
Pour les questionnaires << salariés >> :<br />
La Dares est responsable du redressement des questionnaires salariés. Les variables centrales de l'enquête (salaire brut et nombre d'heures rémunérées) sont contrôlées principalement à l'aide des données individuelles issues de la base << tous salariés >>. Les grands principes des opérations de redressement sont les suivants :<br />
- La valeur collectée par le questionnaire est conservée même en cas d'incohérence avec la valeur DSN, dès lors que les réponses données aux différentes questions du questionnaire sont cohérentes entre elles ;<br />
- Lorsque sont détectées des valeurs aberrantes ou manquantes ou encore des incohérences internes ou avec les données de la DSN, certaines variables sont redressées par imputations déterministes avec les variables de la DSN, d'autres sont redressées par modélisation (imputation statistique). Quelle que soit la source (questionnaire ou enrichissement) les données de rémunération sont considérées comme plus fiables que les données portant sur les durées ; ce sont donc les durées qui sont modifiées en cas d'incohérence.<br />
En aval de ces redressements, la Dares calcule un premier jeu de poids << salarié >> corrigé de la non-réponse totale en réallouant les poids des unités non répondantes sur les répondantes appartenant à la même strate de tirage.<br />
L'Insee effectue ensuite une seconde salve de redressements sur les données des salariés, pour satisfaire aux contraintes imposées par Eurostat. Notamment, un traitement particulier est réalisé pour les salariés au forfait, pour lesquels Eurostat souhaite que soient fournies un nombre d'heures rémunérées.<br />
Ce travail d'expertise permet d'obtenir pour chaque année d'enquête la base redressée non calée qui, après le calage effectué à l'Insee devient la base annuelle de diffusion nationale.<br />
Pour les questionnaires << établissements >><br />
Le redressement des questionnaires << établissements >> concerne particulièrement le format Ecmo où la partie établissement est essentielle pour répondre à Eurostat. On distingue tout d'abord les répondants selon leur niveau de réponse : ils peuvent en effet répondre parfois pour l'établissement ou pour l'entreprise lorsque l'information au niveau établissement n'est pas connue. La table établissements est ensuite apurée en éliminant les établissements pour lesquels on constate ou on considère une non-réponse totale. Sont considérées en non-réponse totale les établissements ne répondant pas à un bloc entier de variable ou à certaines variables dites << clés >>, comme celles portant sur les charges ou la masse salariale. Comme pour les questionnaires salariés, des premiers poids sont calculés, en réallouant les poids des unités non répondantes de manière homogène sur les unités répondantes appartenant à la même strate de tirage. Ensuite, les réponses manquantes ou mal renseignées aux questions autres que les questions << clés >> et qui conduisent à classer l'établissement en non-réponse totale sont redressées par imputation, notamment par hot-deck.<br />
<strong>Traitement des unités influentes</strong><br />
Un traitement des unités influentes est effectué, qui permet de contrôler l' << influence >> d'individus qui, de par leur réponse et leur poids élevé - et sans que leur réponse ne soit erronée -- conduisent à des mesures certes toujours sans biais mais potentiellement bien moins précises des statistiques d'intérêt sur les domaines auxquels ils appartiennent. On applique pour cela une technique de winsorisation (méthode de Kokic et Bell) qui modifie le poids de l'individu influent sans pour autant perdre l'information de sa réponse.<br />
<strong>Calages sur marges</strong><br />
1. On cale pour chaque enquête annuelle les variables directement issues du fichier << tous salariés >> exhaustif sur les marges de la population totale en emploi salarié issues de ce même fichier, selon de nombreux critères (catégorie sociale x sexe, localisation géographique, etc.).<br />
2. Après concaténation des fichiers annuels pour le rendu Eurostat, on cale une deuxième fois l'ensemble sur les marges relatives à l'année de validité de l'enquête.<br />
Chacun des calages sur marges est réalisé grâce à la procédure Calmar.<br />
<strong>Rendu Eurostat</strong><br />
Les tables envoyées à Eurostat utilisent toujours deux enquêtes annuelles successives. Sur la base concaténée, des derniers redressements sont faits pour satisfaire aux contraintes imposées par Eurostat. Ces contraintes sont d'abord des bornes strictes pour plusieurs variables (temps de travail, valorisation des heures supplémentaires par exemple), ou l'absence de non-réponse partielle (suppression des individus dont certaines variables sont manquantes). En format Ecmo, on procède également à une dernière étape spécifique de mise en cohérence de certaines informations issues du questionnaire salarié et d'informations issues du questionnaire établissements.</p> |