56 57 INEWS 64 - A revista do INE INEWS 64 - A revista do INE Metodologia O projeto iniciou-se com a utilização de ortofotomapas de 2018, com resolução espacial de 25 cm, fornecidos pela Direção-Geral do Território. A metodologia seguida neste projeto (Figura 1) foi estruturada em fases distintas com recursos a ferramentas de deep learning em ambiente de Sistemas de Informação Geográfica (SIG), especificamente concebidas para tarefas de geoprocessamento de Deep Learning baseadas em imagens de satélite. Figura 1. Fluxo geral da metodologia Inicialmente, foram selecionadas áreas geográficas representativas da diversidade territorial do Continente, considerando diferentes níveis de urbanização e tipos de povoamento, com base na Tipologia de Áreas Urbanas (TIPAU). Para cada folha de imagem, contabilizou-se o número de edifícios existentes na BGE, identificou-se o polígono TIPAU dominante e classificaramse as imagens por tipologia. No conjunto das imagens selecionadas, foi obtida uma amostra com cerca de 130 000 edifícios (polígonos) digitalizados manualmente, que constituiu a base para o treino e validação dos modelos de Deep Learning (Figura 2). Figura 2. Seleção de folhas de imagem e respetiva classificação TIPAU Foram utilizados dois modelos principais de Deep Learning: o Mask R-CNN, conhecido pela sua capacidade robusta na segmentação de instâncias individuais (ou seja, identificação e classificação de objetos a partir da análise de imagens), e o Segment Anything Model (SAM), uma abordagem recente e versátil que permite segmentação orientada por prompts (pontos, caixas ou texto). Ambos os modelos foram implementados com o apoio de um conjunto de ferramentas de geoprocessamento capazes de detetar características específicas numa imagem a partir de modelos previamente treinados pelos utilizadores, numa perspetiva de aprendizagem automática. Após a digitalização dos polígonos dos edifícios, foram gerados chips de imagem (image tiles) e metadados associados, que foram posteriormente exportados em formatos compatíveis com as redes neuronais. Durante a fase de treino, os modelos foram ajustados com diferentes parâmetros (como batch size e número de épocas), usando um conjunto entre 3 000 e 13 000 edifícios anotados manualmente.
RkJQdWJsaXNoZXIy MjM5MTA=