Census with Administrative Data
To celebrate the European Statistics Day (20 October), Statistics Portugal announces the progress of the Census with administrative data to be executed after the 2021 Census. This project is part of the National Data Infrastructure that embodies Statistics Portugal's strategy of integration and value creation for society from different data sources. Central to the project is the constitution of the Resident Population Database covering a set of characteristics - geographical, demographic and socio-economic - of the resident population in Portugal and results from the integration of information from various sources of the public administration.
Population and housing censuses represent one of the pillars of any National Statistical System concerning the enumeration and characterization of the population and households, at national, regional and local levels, producing essential indicators for the definition of public policies and decision-making.
Statistics Portugal is working on the transformation of the traditional census model into a more efficient one using administrative data. Due to its dimension, this is perhaps Statistical Portugal´s most ambitious project of data integration from administrative sources.
The project is part of the development of a National Data Infrastructure which embodies Statistics Portugal's strategy of integration and creation of value for society from different data sources. Taking advantage of Statistics Portugal´s competences, tasks and mission, the National Data Infrastructure seeks to respond to an increasingly complex society with new expectations towards statistics.
Within the scope of the Census, Statistics Portugal has been studying the contribution of available administrative data with potential to replace information collected through full enumeration (traditional model) after the 2021 Census.
The project is a key element in the strategy of paradigm shifting and places Portugal in a more favorable position regarding its international obligations, namely the production of annual census statistics after 2024 as recommended by the European Union.
THE UNITED NATIONS CLASSIFIES CENSUS MODELS INTO THREE GROUPS
Source: Recommendations for the 2020 Censuses of Population and Housing, United Nations Economic Commission for Europe (UNECE), 2015.
The process of transition to more efficient census model began several decades ago in the Nordic countries. This movement has extended to an increasing number of countries that have evolved into registered-based or combined models.
Evolução do modelo censitário nos países da UNECE
Fonte: United Nations Economic Commission for Europe (UNECE), 2016
Os Censos baseados em dados provenientes de fontes administrativas apresentam vantagens evidentes ao nível da eficiência dos sistemas estatísticos.
Principais vantagens do censo administrativo
O projeto Censos com Dados Administrativos surgiu em 2014 no âmbito do Estudo de Viabilidade para um novo modelo censitário em 2021. Está alinhado com os trabalhos em desenvolvimento em países com sistemas estatísticos de referência como o Reino Unido ou o Canadá.
Principais datas do projeto Censos com Dados Administrativos
A Base de População Residente (BPR) constitui o elemento central do projeto Censos com Dados Administrativos:
- É constituída pela população residente em Portugal e cobre um conjunto de características geográficas, demográficas e socioeconómicas;
- Resulta da integração de informação administrativa proveniente de diversas fontes da Administração Pública.
Fontes de dados administrativos integrados na BPR
O acesso à informação administrativa é enquadrado por um conjunto de instrumentos legais:
- Lei nº 22/2008 de 13 de maio, que estabelece os princípios, as normas e a estrutura do Sistema Estatístico Nacional;
- Regulamento 223/2009 de 11 de março, relativo às estatísticas Europeias, alterado pelo Regulamento 2015/759 de 29 de abril;
- Lei 6/2019 de 11 de janeiro, que autoriza o Governo a estabelecer normas a que devem obedecer o XVI Recenseamento Geral da População e o VI Recenseamento Geral da Habitação, e Decreto-Lei nº 54/2019 de 18 de abril que estabelece as normas a que deve obedecer a realização do XVI Recenseamento Geral da População e do VI Recenseamento Geral da Habitação (Censos 2021);
- Deliberações da Comissão Nacional de Proteção de Dados nº 929/2014 de 11 de junho e nº 163/2017 de 31 de janeiro;
- Protocolos de colaboração com as entidades responsáveis pelas fontes administrativas especificando o desenho de registo e as datas de transmissão da informação administrativa e as medidas de segurança de informação, cumprindo o estipulado na lei do SEN e no Regulamento Geral de Proteção de Dados.
A confidencialidade da informação é assegurada através de um conjunto de medidas de segurança na transmissão e no tratamento dos dados, seguindo o princípio do segredo estatístico a que está sujeita toda a atividade do INE. Acresce que os dados são sempre utilizados com o fim estatístico, não sendo possível a identificação de um indivíduo em particular ou a sua utilização por terceiros.
Abordagem metodológica
A BPR é construída através da aplicação de técnicas de record linkage e matching tendo em vista a integração de informação administrativa das diferentes fontes. Portugal não dispõe de um número de identificação único, utilizado transversalmente pelas várias entidades da Administração Pública, colocando desafios acrescidos à integração da informação das diferentes bases de dados administrativas. Em particular, é necessário determinar se uma pessoa reside no território nacional, o que corresponde ao conceito de população residente associado às operações censitárias. Para chegar a este conceito é aplicado um conjunto de regras designadas de “indícios de residência”. Estas regras permitem validar a residência em Portugal através da presença do indivíduo nas diferentes bases de dados administrativas (e.g., o indivíduo trabalha, frequenta o sistema de ensino, paga impostos, está inscrito no centro de emprego,…).
Estimada a população residente, são posteriormente associadas as variáveis administrativas com interesse censitário e que permitem a caracterização da população em diferentes domínios.
A BPR é construída anualmente com data de referência a 31 de Dezembro. Até ao momento foram realizados três exercícios.
Principais etapas na construção da BPR
Principais resultados: contagem da população em 2017
A população estimada através de dados administrativos pela BPR, para o ano de 2017, é de 10 256 842 indivíduos, o que representa um desvio de apenas -0,3% face
às Estimativas da População Residente publicadas pelo INE para o mesmo ano. As Estimativas da População Residente do INE disponibilizam os valores oficiais da população residente em Portugal, sendo um estudo estatístico que adota o método das componentes por coortes e assenta no conceito censitário de população (atualmente ancorado nos Censos 2011). O seu cálculo desenvolve-se com base nas componentes demográficas natural e migratória, tendo por base informação de outras operações estatísticas do INE: nados-vivos; óbitos; estimativas da emigração e da imigração.
Os resultados obtidos no projeto Censos com Dados Administrativos são muito positivos, considerando os diferentes pressupostos, as metodologias e as fontes distintas destes dois estudos estatísticos: BPR e Estimativas da População Residente.
População residente 2015 a 2017:
BPR, Estimativas da População Residente e diferença relativa
A nível regional (NUTS II) as diferenças entre a BPR 2017 e as Estimativas da População Residente para o mesmo ano variam entre -1,87% e 0,64%.
População residente por NUTS II 2017:
Diferença entre BPR e Estimativas da População, %
Fonte: INE, I.P., Estimativas da População Residente, 2017; Base de População Residente, 2017.
Os resultados da BPR são também promissores ao nível dos 308 municípios do país: para 2017, mais de 76% dos municípios apresentam níveis de subestimação ou sobrestimação face às Estimativas da População Residente inferiores a 5%; de referir que em 77 municípios do país as diferenças relativas variam entre -1% e 1%. Apenas um número reduzido de municípios (10) apresentam diferenças relativas superiores ou inferiores a 10%.
População residente por Município 2017:
Diferença entre BPR e Estimativas da População Residente, %

Fonte: INE, I.P., Estimativas da População Residente, 2017; Base de População Residente, 2017.
A par da distribuição geográfica, a BPR já capta parte das dimensões demográficas e socioeconómicas. Por exemplo, as diferenças nas estruturas etária da população residente oriundas da BPR e das Estimativas da População Residente são pouco expressivas para a generalidade dos grupos etários.
População por grupo etário e sexo, 2017:
BPR e Estimativas da População Residente

Fonte: INE, I.P., Estimativas da População Residente, 2017; Base de População Residente, 2017.
A BPR disponibiliza atualmente informação para 18 variáveis, das quais 11 caracterizam totalmente o universo populacional e 7 têm cobertura parcial. Na área do emprego e mercado de trabalho, por exemplo, não há ainda informação relativa à profissão para os trabalhadores da Administração Pública.
Variáveis censitárias disponíveis na BPR

Considerações finais e desenvolvimentos futuros
O conjunto de informação administrativa atualmente integrada na BPR tem um elevado potencial para a construção dos Censos com Dados Administrativos. Contudo, foram identificadas diversas áreas críticas que inviabilizam a transição imediata para um modelo administrativo nos Censos 2021:
- Acesso à totalidade da informação administrativa necessária aos Censos;
- Cobertura total em todas as variáveis censitárias obrigatórias;
- Informação sobre as estruturas familiares e alojamentos;
- Divulgação para níveis geográficos muito finos (Grid 1Km2).
A disponibilidade de informação administrativa ainda é incompleta, seja por necessidade de acessos ainda a protocolar, seja por informação que não existe diretamente e tem de ser trabalhada. O caso das estruturas familiares é paradigmático, em que é necessário assegurar o acesso aos dados relativos à filiação/relações de parentesco e tratamento posterior para chegar aos conceitos de agregado doméstico e de núcleo familiar.
Será ainda necessário analisar e tratar as moradas e, através da georreferenciação dos edifícios/alojamentos, desenvolver uma solução para a divulgação de estatísticas da população por uma quadrícula geográfica de 1Km2.
O projeto Censos com Dados Administrativos constitui uma linha estratégica de ação do INE, capaz de dar resposta às exigências da informação estatística oficial. No limite, ter-se-á mesmo um Censos em contínuo que poderá ser atualizado numa periocidade infra-anual, assim permitam as fontes administrativas.
A BPR fornece uma estrutura de informação que integrada com dados, por exemplo, sobre rendimentos e habitação, permitirá criar novos indicadores estatísticos e expandir as possibilidades de análise (e.g., incidência da pobreza ou abandono escolar), com maior detalhe geográfico, demográfico e socioeconómico.
Integração da informação de indivíduos, agregados familiares e alojamento

O INE agradece às entidades da Administração Pública que contribuem com a informação administrativa e tornam possível a realização deste projeto, considerado decisivo para a modernização do Sistema Estatístico Nacional.