Sobrenomes e ancestralidade no Brasil

O meu Texto para Discussão Ipea está on-line:
TD 2229 - Sobrenomes e Ancestralidade no Brasil 
Este trabalho apresenta um método de classificação da ancestralidade dos sobrenomes dos brasileiros nas seguintes classes: ibérica, italiana, japonesa, alemã e leste europeia. A partir de fontes históricas diversas, montou-se uma base de dados da ancestralidade dos sobrenomes. Essas informações formam a base para a aplicação de algoritmos de classificação de fuzzy matching e de machine learning nos mais de 46 milhões de trabalhadores da Relação Anual de Informações Sociais (Rais) Migra de 2013. A imensa maioria (96,4%) dos sobrenomes únicos da Rais foi identificada com o processo de fuzzy matching e os demais com o método proposto por Cavnar e Trenkle (1994). A comparação dos resultados do procedimento com dados sobre estrangeiros no Censo Demográfico de 1920 e a distribuição geográfica dos sobrenomes não ibéricos reforçam a acurácia do procedimento.
Comentários são - como sempre- bem-vindos!

2 comentários:

Anônimo disse...

interessante para geneticistas pois sabe-se quer o sobrenome é transmitido juntamente com o cromossomo Y (homens com mesmo sobrenome potencialmente compartilham o mesmmo Y). Excetuando tal exemplo em quais outras aplicações esse estudo pode ser útil? Por curiosidade, Monastério é de onde?
obrigado

Leonardo Monasterio disse...

Obrigado pelos comentários. Eu vou utilizar para impacto de LP da imigração e mobilidade social. (mas tem um monte de outros usos, inclusive para epidemiologia).
Meu "monasterio" veio do meu pai boliviano. Como é um toponímico pode ter várias origem, mas acho que todas hispânicas.

Tecnologia do Blogger.