Contenu archivé

L'information qui porte la mention « archivée » est fournie à des fins de référence, de recherche ou de tenue de documents. Elle n'est pas assujettie aux normes Web du gouvernement du Canada et elle n'a pas été modifiée ou mise à jour depuis son archivage. Pour obtenir cette information dans un autre format, contactez-nous.

Aperçu du Recensement de la population
Chapitre 8 – Évaluation de la qualité des données

Introduction

L'évaluation de la qualité des données permet d'évaluer tous les aspects de la qualité des données du recensement. Les résultats servent à informer les utilisateurs de la fiabilité des données, à apporter des améliorations au prochain recensement et, dans le cas de deux études sur la couverture, à rectifier les prévisions démographiques officielles. Des activités d'évaluation de la qualité sont mises en œuvre tout au long du processus du recensement, lesquelles commencent avant la collecte des données et se terminent après la diffusion.

Sources des erreurs

Quel que soit le soin apporté à la conception du recensement, les données recueillies comporteront inévitablement des erreurs. Ces erreurs peuvent survenir pratiquement à tout moment du processus, depuis la préparation du matériel jusqu'à l'établissement de la liste des logements et de la collecte des données, tout comme elles peuvent se produire lors du traitement de celles-ci. Les utilisateurs des données du recensement doivent être conscients de l'existence des types d'erreurs qui peuvent survenir afin de pouvoir évaluer la pertinence des données à savoir si elles répondent à leurs besoins.

Types d'erreurs principaux :

Les erreurs de couverture se produisent lorsque des logements et/ou des personnes sont omis, incorrectement dénombrés ou dénombrés plus d'une fois.

Les erreurs dues à la non-réponse surviennent lorsqu'une partie des renseignements ou tous les renseignements concernant un répondant en particulier, des ménages ou des logements n'ont pas été fournis.

Les erreurs de réponse se produisent lorsqu'une question est mal comprise ou lorsqu'une caractéristique est mal déclarée par le répondant, par l'agent recenseur ou par le téléphoniste de l'Assistance téléphonique du recensement.

Les erreurs de traitement peuvent se manifester à diverses étapes du traitement. Les erreurs de traitement comprennent des erreurs de frappe lors de la saisie des données pendant les opérations de codage, lorsque les réponses en toutes lettres sont converties en codes numériques et à l'imputation, lorsqu'une réponse valide (pas nécessairement exacte) est insérée dans un enregistrement pour remplacer une réponse manquante ou invalide.

Les erreurs d'échantillonnage s'appliquent uniquement lorsque les réponses aux questions sont obtenues à partir d'un échantillon. Ce type d'erreur ne s'applique pas au Recensement de 2011.

Mesure de la qualité des données

Un bon nombre d'études sur la qualité des données ont été effectuées lors de recensements récents afin de permettre aux utilisateurs d'évaluer les répercussions des erreurs et d'améliorer leur propre compréhension de la façon dont les erreurs surviennent. Dans le cadre du Recensement de 2011, des études spéciales ont pour but d'examiner les erreurs de couverture et la qualité des données, c'est‑à‑dire la non-réponse, la réponse et le traitement.

Trois études sont menées pour évaluer les erreurs de couverture :

  1. Enquête sur la classification des logements – La classification erronée des logements constitue l'une des sources des erreurs de couverture le Jour du recensement. Cette erreur peut se produire lorsqu'un logement occupé est classé dans la catégorie des logements inoccupés, ou lorsqu'un logement inoccupé est classé comme un logement occupé. Cette mauvaise classification peut avoir une incidence sur divers logements pour lesquels un questionnaire du recensement n'a pas été retourné (logement non-répondant). L'Enquête sur la classification des logements vise à étudier ces types d'erreurs de classification. On communiquera avec un échantillon de logements pour lesquels un questionnaire de recensement n'a pas été retourné, on détermine si le logement est occupé ou non et, s'il l'est, on recueille des renseignements sur le nombre d'occupants.

    Ces renseignements servent à ajuster les données du recensement relatives aux ménages et aux personnes, à corriger les erreurs de classification et à ajuster la répartition de la taille des ménages au moyen de l'imputation des données pour les logements non répondants. Toutes ces opérations sont effectuées à temps pour la diffusion initiale des chiffres de population.

  2. Contre-vérification des dossiers – Cette étude permet d'estimer le nombre de personnes omises dans le cadre du recensement (une fois pris en compte les rajustements décrits dans l'Enquête sur la classification des logements, ci-dessus). Des estimations sont élaborées pour chaque province et territoire ainsi que pour divers sous-groupes de la population (p. ex., les groupes définis selon l'âge et le sexe, et l'état matrimonial).

    Pour les provinces, la contre-vérification des dossiers se fait en deux étapes :

    • Étape 1 : L'élaboration d'un échantillon de personnes qui devraient être dénombrées dans le cadre du recensement, à partir de diverses sources telles que le recensement antérieur, les registres des naissances, les dossiers d'immigration, et des résidents non permanents et la Contre-vérification des dossiers du dernier recensement (pour tenir compte des omissions du recensement antérieur).

    • Étape 2 : Vérifier la base de données des réponses du recensement afin de déterminer si ces personnes ont été dénombrées. Certaines personnes doivent être dépistées et interviewées afin de recueillir des renseignements supplémentaires. Les personnes décédées ou qui ont émigré avant le Jour du recensement sont identifiées durant le dépistage ou lors d'interviews.

    Pour ce qui est des territoires, il y a quelques différences à l'étape 1. À des fins d'échantillonnage, l'information qui identifie les répondants (comme le nom, la date de naissance et le sexe) des dossiers médicaux est appariée aux dossiers du recensement afin d'identifier les personnes qui ont été recensées lors du recensement. L'échantillon pour la Contre-vérification des dossiers est ensuite choisi parmi les personnes non appariées.

    Les résultats de cette étude constituent la source de renseignements la plus importante sur les personnes omises dans le cadre du recensement. Toutefois, contrairement à l'Enquête sur la classification des logements, ces estimations ne servent pas à rajuster les données du recensement avant la diffusion initiale des chiffres de population.

  3. Étude sur le surdénombrement du recensement – Dans le cadre des recensements de 2011 et de 2006, le dénombrement en double des personnes a été détecté en cherchant des enregistrements couplés qui possèdent une qualité élevée d'appariement quant au sexe et la date de naissance et au nom. Les deux techniques de couplage déterministe (exacte) et probabiliste ont été utilisées. Des paires potentielles de surdénombrement ont été échantillonnées et vérifiées manuellement; les résultats ont été utilisés pour estimer le surdénombrement du recensement.

    La combinaison des résultats de la Contre-vérification des dossiers et des résultats de l'Étude sur le surdénombrement du recensement permet d'estimer l'erreur de couverture nette dans les données du recensement. Elles sont utilisées pour dériver les chiffres de population officiels.

Certification

La certification consiste en plusieurs activités servant à évaluer rigoureusement la qualité des données du recensement à des niveaux géographiques précis afin d'assurer que les normes de qualité pour la diffusion au grand public soient respectées. Cette évaluation comprend la certification des chiffres de population et des logements ainsi que la certification des variables liées aux caractéristiques des logements et de la population.

Les composantes de la certification des données sont :

  • la révision et l'analyse des indicateurs de qualité des données afin d'en vérifier la cohérence interne et externe
  • la présentation d'un énoncé de qualité des données
  • les recommandations et l'approbation des données pour la diffusion
  • le formatage des données finales diffusées incluant des avis aux utilisateurs par le biais de notes spéciales, de mises en garde ou autres indicateurs de la qualité des données.

Pendant la certification, les taux de réponse, les réponses invalides, les taux de rejet au contrôle ainsi que la comparaison des estimations avant et après l'imputation sont parmi les mesures utilisées. Les totalisations du Recensement de 2011 sont produites et comparées aux données correspondantes des recensements antérieurs, d'autres enquêtes et d'autres sources administratives. Les tableaux croisés détaillés sont aussi vérifiés pour en assurer la cohérence et la précision.

Selon les résultats de la certification, les données du recensement peuvent être diffusées de trois façons.

  • Premièrement, les données peuvent être diffusées sans restriction, reflétant des données de qualité suffisante.

  • Deuxièmement, les données peuvent être diffusées de manière conditionnelle ou de façon restrictive. Dans ce cas, les données seront diffusées avec une note spéciale alertant les utilisateurs des limitations possibles ou, les données peuvent aussi être traitées de façon particulière, par exemple, en combinant des catégories de déclaration pour répondre à des préoccupations en matière de qualité ou de confidentialité.

  • Finalement, les données peuvent être supprimées pour des raisons de qualité.
Date de modification :