Pular para o conteúdo principal

"Seu filho não é nenhum Einstein": primeiros nomes e carreiras científicas

Um pouco por curiosidade e também para aprender a trabalhar com bases grandes de nomes no R, fiz o seguinte exercício:

  • Contei os brasileiros na base do Lattes (aproximadamente 1,5 milhão de pessoas) que têm nomes de cientistas famosos (coluna Science);
  • Na Rais identificada, busquei os com nível superior (uns 6 milhões) que também tivessem nomes de cientistas (coluna General);
  • As colunas "Share Science" e "Share General" indicam o número de primeiros nomes famosos por milhão no Lattes e na Rais 
  • A coluna "ratio" é a razão entre os dois shares. Valores iguais a 1 indicam que os nomes são igualmente represntados em ambas as bases. Valores maiores que 1 indicam que o nome está sobrerepresentado na base do Lattes. Há, por exemplo, 29,5 "Arquimedes" por milhão na base Lattes; e apenas 24,2 na população em geral. Isso resulta na razão de 1,2.

O resultado é que- de fato - existe mesmo mais gente com nome de cientista na base do Lattes do que seria esperado. Contudo, o efeito não é lá grande coisa. Em outras palavras, talvez mesmo pais apaixonados por Ciência (a ponto de batizar o filho com nome de Darwin!) são incapazes de transmitir suas preferências para as próximas gerações.

Obviamente, há dezenas de restrições e ressalvas nessa minha interpretação dos resultados. Comentários, de qualquer forma, são bem-vindos.

Comentários

p disse…
Tentou Tesla?
Não testei, mas chuto que os primeiros Tesla devem estar nascendo agora.
(Coitado do moleque que tem nome de carro :-))
A alta razao de pessoas com nome `Washington` no Brasil se deve a forte identificacao do povo brasileiro com os valores da democracia norte americana ;) soh enchendo seu saco.

E faz sentido voce fazer uma 'media' desse ration para diferentes nomes? Tem uma variancia consideranvel de ratio entre os diferentes nomes

Outra coisa eh corririr para erros de digitacao/variacoes do escriturario, tipo Galileu e Galileo, ou Galilleu etc
"A alta razao de pessoas com nome `Washington` no Brasil se deve a forte identificacao do povo brasileiro com os valores da democracia norte americana ;) soh enchendo seu saco."
Mentira! Quem é federalista mesmo escreve "Uóxton". (Deve ter um monte de Edison dos pais que tentaram batizar de Pelé, mas a mãe- sensatamente- não cedeu)

Eu usei só a versão aportuguesada mesmo. O próximo passo é usar o fuzzy matching.



Duany Rambo disse…
Este comentário foi removido pelo autor.
Lucas Carvalho disse…
Como você obteve acesso à RAIS identificada?
Eu tenho acesso no servidor do Ipea.

Postagens mais visitadas deste blog

A regra dos dois desvios

Ao que parece, a regra será a minha maior (e única) contribuição ao Saber Universal. Eu a reproduzi no verbete "Brigas, críticas e debates" do meu magnum opus "Manual de sobrevivência na universidade: da graduação ao pós-doutorado" ( Atualização 2017: O livro está fora do ar porque uma segunda edição, expandida, será publicada em breve). Aí vai:

" "Nunca brigue se o adversário estiver a mais de dois desvios padrãode você em qualquer dimensão: conhecimento, ideologia, inteligência ou porte físico." Se você não sabe o que é desvio padrão, nenhum problema. Traduzindo: nunca brigue se o adversário for muito melhor ou pior do que você em qualquer dimensão: conhecimento, ideologia, inteligência ou porte físico. Se o adversário é muito mais inteligente ou conhece muito melhor o assunto, ouça-o com atenção, faça as perguntas relevantes e aprenda. Não é vergonha. Agora, se o sujeito é burro ou ignorante no assunto, o melhor é desconsiderar. Afinal, qual é a…

Colistete e o atraso educacional brasileiro

Ficou ótima a matéria da Revista Piauí com o perfil do Renato Colistete e sobre sua tese de livre-docência (pdf).
Ele é um pesquisador sensacional, gente boa e orientador de 9 entre 10 dos novos pesquisadores em histórica econômica. Já estava no tempo de ele ter reconhecimento de um público mais amplo.
Aproveite e leia o seu blog . Quando a tese estiver on-line, eu aviso.

Cuba é mais rica que o Brasil?

Um texto da internet afirma (não vou incluir o link):
"O povo daquela ilha rochosa bloqueada é mais rico que o povo do continente Brasil. Essa é uma realidade chocante e geralmente desconhecida." O autor recorre aos dados do World Bank que realmente mostram Cuba com um PIB per capita (PPP)  de US$20611 contra US$ 15893 do Brasil.
Obviamente essa estimativa está furada. É tão furada que a ONU - ao calcular o IDH- estimou outro valor que até os órgãos oficiais de Cuba acharam mais razoável:
The 2013 HDI value published in the 2014 Human Development Report was based on miscalculated GNI per capita in 2011 PPP dollars, as published in the World Bank (2014). A more realistic value, based on the model developed by HDRO and verified and accepted by Cuba’s National Statistics Office, is $7,222. The corresponding 2013 HDI value is 0.759 and the rank is 69th. A mesma fonte coloca o Brasil como tendo renda per capita de US$ 15175. Ou seja, Cuba tem a metade da renda per capita brasilei…