RESUMO
Os números não mentem, mas se os números não forem interpretados da maneira mais correta, podem levar a conclusões muito perigosas. No caso do Dr. Richard Lynn, uma interpretação errada dos números o levou a passar décadas promovendo o racismo, apoiado em fatos científicos mal interpretados. Com o título de “Professor Emérito”, numerosas mídias aceitaram publicar seus artigos, entretanto, uma análise mais profunda dos mesmos dados nos quais Lynn se baseou revelam fatos muito diferentes.
Em 2002, foi publicado um estudo de Richard Lynn e Tatu Vanhanen intitulado “IQ and the Wealth of Nations”, no qual os autores tentavam explicar a condição de pobreza de alguns países a partir da baixa capacidade intelectual. Naquela época, o artigo gerou uma polêmica generalizada, principalmente nas sociedades de alto QI. Na mesma época, apontei alguns erros científicos cometidos por Lynn, entretanto os textos dele continuaram a se propagar e hoje são amplamente disseminados e reproduzidos em numerosos sites, inclusive em portais respeitáveis. Essa é uma situação perigosa, porque esses erros podem motivar atos de opressão, discriminação, eugenia e até mesmo nazismo.
Um dos motivos pelos quais os artigos de Lynn continuam a ser bem aceitos se deve à fragilidade das críticas de seus antagonistas. Lynn tem sido alvo de muitos ataques pessoais e críticas sem suporte nos fatos, críticas políticas, sociais e ideológicas, carregadas de apelos emocionais e falácias moralistas.
Os estudos de Lynn, embora contenham erros, apresentam bom nível técnico e se apoiam em dados empíricos, enquanto a maioria de seus antagonistas se limitava (e continua se limitando) a tentar desqualificá-lo sob a alegação de que Lynn é simpatizante do nazismo e é colunista em revistas de supremacia branca. Se Hitler tivesse encomendado um estudo que mostrasse que os pigmeus do Congo são, em média, mais baixos do que os cidadãos holandeses, não faria sentido criticar os resultados numéricos com base nas ideologias de Hitler. Do mesmo modo, as críticas que se faz a Lynn são inócuas. Para refutá-lo de forma conclusiva é necessário apresentar uma análise baseada em fatos científicos e argumentos lógicos, com maior profundidade e maior rigor do que análises que ele realizou, é necessário perscrutar nuances que Lynn não considerou, e mostrar o impacto desses detalhes para a interpretação correta dos resultados. Essa é a proposta desse artigo.
Muitas críticas já foram feitas aos estudos de Lynn, mas geralmente são emotivas, subjetivas, estimuladas por interesses políticos e sem embasamento científico. Entretanto, há erros metodológicos, erros de modelagem e erros de interpretação que precisam de uma revisão sistemática e meticulosa.
Algumas das críticas subjetivas também são bem embasadas, há muitos pontos que poderiam ser discutidos, como adequação dos testes de QI utilizados, inclusive validade de constructo e vieses culturais. Embora na maioria das vezes tenha sido usado o Raven, que é considerado “cultue fair”, essa característica é válida quando o teste é aplicado em cidadãos urbanos que vivem em regiões tecnologicamente desenvolvidas, mas não se pode assumir a priori que sejam igualmente “cultue fair” quando aplicados em povos que vivem da caça e rudimentos de agricultura. Povos que nunca exercitaram o pensamento abstrato com questões matemáticas e geométricas, certamente não terão mesma facilidade para solucionar questões do Raven. Se as diferenças indicadas por Lynn fossem genéticas, ou predominantemente genéticas, ele precisaria explicar como os egípcios foram a civilização mais desenvolvida e bem-sucedida do mundo durante milênios, entre outras inconsistências.
Nosso propósito não é discutir detalhes polêmicos, ainda que as evidências nesses detalhes pesem contra as interpretações de Lynn e Vanhanen. Nosso foco está em aspectos objetivos, quantitativos, de caráter lógico e estatístico, por meio dos quais pode ser feita uma refutação mais rigorosa e conclusiva, não apenas apontando erros e invalidando os resultados obtidos por Lynn, mas principalmente revisando esses resultados e indicando escores mais próximos dos corretos, escores mais representativos das verdadeiras capacidades intelectuais em cada país.
Não queremos fingir que não existem diferenças regionais ou étnicas, mas precisamos mostrar que essas diferenças são muito menores do que os números indicados nos estudos de Lynn.
Para isso, farei uma análise sistemática da versão mais recente do artigo de Lynn, apontando os erros mais graves e corrigindo-os de modo a produzir uma lista revisada com os QIs mais próximos dos corretos para os países sobre os quais existem dados suficientes.
Lynn foi professor emérito da universidade de Ulster e escreveu artigos interessantes sobre Psicometria. Também escreveu artigos questionáveis sobre outros assuntos, tentando defender teses de supremacia branca e propostas eugenistas. Grande parte da obra de Lynn se apoia em fatos empíricos e análises objetivas, porém outra parte de sua obra está contaminada por vieses ideológicos, erros conceituais, erros técnicos, erros epistemológicos, omissões de fatos relevantes na interpretação dos dados etc.
O número de falhas é grande, por isso nos concentraremos na análise das mais graves, apenas analisando brevemente os erros de importância secundária, e enumerando, sem comentar, alguns dos erros de importância terciária e outros erros mais marginais.
A ideia central defendida por Lynn está certa, mas quantitativamente ele força resultados exagerados. Existem diferenças étnicas e regionais, isso é um fato, mas as diferenças não são tão grandes quanto ele quer fazer parecer. Ele negligenciou alguns efeitos importantes, que afetam os escores em diferentes medidas nas diferentes regiões.
De acordo com Lynn, o QI médio em Guiné Equatorial é 53. Se isso estivesse certo, seria esperado que o país fosse uma grande tribo de nômades, eles não teriam dominado a técnica de produzir fogo, não teriam construído arados, lanças etc. Mas existe uma civilização urbana lá. As fotos abaixo mostram um pouco da Arquitetura em Malabo, capital de Guiné Equatorial.
Pessoas com QI abaixo de 75 têm dificuldade para aprender a ler e somar, abaixo de 60 têm dificuldade para aprender a amarrar os sapatos. Não seria muito razoável que uma população com QI médio 53 fosse responsável por essas obras arquitetônicas.
Além disso, em países com ampla infraestrutura e incentivo à alfabetização, como na Europa e na América do Norte, onde as pessoas são incentivadas a estudar, aquelas com QI abaixo de 60 têm muita dificuldade para aprender a desenhar as letras. Se o QI estimado por Lynn para Guiné Equatorial estivesse correto, menos de 2% da população estaria alfabetizada, e isso não é compatível com a situação real de Guiné, onde 91% da população é alfabetizada.
O filme Forrest Gump tem como protagonista um personagem que interpreta uma pessoa com 75 de QI. O protagonista do filme Ray Man – que algumas fontes alegam ser inspirado na vida de William Shanks – teve o QI estimado em 70. A gorila Koko teve o QI avaliado entre 75 e 95. Embora haja erros e exageros no caso de Koko, esses números proporcionam uma ideia aproximada sobre o nível intelectual de uma pessoa com 70 a 75 de QI, e deixa claro que não há civilizações urbanas atuais nas quais a média do país seja menor do que 80, e em poucos casos pode ser menor do que 90.
Mesmo que a informação sobre 91% da população de Guiné Equatorial ser alfabetizada seja um dado maquiada, e os números verdadeiros sejam piores, algo como 70% ou mesmo 50%, ainda é muito maior do que seria esperado se o QI médio fosse 53.
Precisamos considerar também que, em países mais pobres, o ambiente oferece menor incentivo ao aprendizado, o que torna ainda mais difícil explicar como essa população poderia ter QI médio 53, e ainda assim ser predominantemente alfabetizada.
Escolhi o exemplo de Guiné Equatorial por haver dados mais detalhados e mais seguros para comparar, mas o mesmo argumento se aplica com maior vigor no caso de Nepal, onde Lynn alega que o QI médio da população é 43.
Outro detalhe notável é sobre o QI médio em Israel. Alguns textos de Lynn sugerem forte ligação com o neonazismo e antissemitismo, e isso também se reflete no QI médio que ele atribui à população de Israel: 92. O QI “normal” é 100 e com cerca de 90 a pessoa já apresenta ligeira dificuldade em questões cognitivas. Isso é incompatível com o fato de que o povo judeu se destaca pela inteligência nitidamente acima da média.
Israel está entre os 11 países com maior número de prêmios Nobel per capita e vários dos empresários mais bem sucedidos são judeus. Estudos independentes dos de Lynn mostram que judeus ashkenazi possuem QI médio em torno de 117, e outros judeus em torno de 111. A União Matemática Internacional divide seus membros em 5 grupos, sendo que o grupo 5 é o mais elevado, reunindo apenas 11 países, um dos quais é Israel, sendo esse detalhe particularmente notável quando se considera que Israel está em 93o em população, portanto tem uma das maiores concentrações de produção matemática per capita.
No caso do Brasil, os resultados de Lynn indicavam QI médio 87 e em revisão mais recente indicam 83,38. Entretanto, uma análise mais séria da situação mostra que o QI real médio do brasileiro não é tão baixo quanto os estudos de Lynn sugerem.
Um dos motivos desses escores é porque muitas pessoas examinadas em estudos em larga escala entregam os questionários dos testes de QI sem responder, ou “chutam” todas as alternativas, ou respondem algumas e “chutam” as demais. Esse efeito pode ser observado nos histogramas de distribuição dos escores, onde existe uma curva semelhante a uma gaussiana com média 96 e desvio padrão 16 e outra curva menor semelhante a uma binomial, com média 30 e desvio padrão 7.
Esses valores para média e desvio padrão da curva binomial dependem de características da amostra e de características do teste. Num teste cujo escore de QI correspondente ao número esperado de acertos para chutes aleatórios seja 60, a média dessa curva menor será perto de 60 ou pouco acima, porque algumas pessoas não chutam todas, mas apenas algumas, ficando com pontuação um pouco acima do acerto casual. Quanto mais pessoas na amostra chutaram muitas ou todas as questões, mais numerosa será essa curva binomial e maior a distorção.
A curva menor, à esquerda, mostra a distribuição binomial das pessoas que chutaram todas ou quase todas as questões, reduzindo o escore médio, não refletindo o verdadeiro nível intelectual dessas pessoas.
Esse efeito também ocorre nos países onde o QI médio medido foi maior, porém não ocorre na mesma proporção. Em países pobres, onde as pessoas estão preocupadas com comida para os filhos e para elas próprias, o empenho em tentar obter o melhor resultado possível num teste de QI, só para satisfazer a uma vaidade pessoal, tem peso muito menor do que em países ricos.
De acordo com estudo publicado no NCBI, um incentivo monetário oferecido às pessoas examinadas produz um incremento médio de 11 pontos no escore, pagando apenas $ 10. Informações mais detalhadas sobre esse estudo podem ser encontradas em:
https://www.nih.gov/news-events/nih-research-matters/motivation-may-influence-iq-scores#:~:text=The%20scientists%20found%20that%20material,or%20about%2015%20IQ%20points.
Esse efeito é bastante notável, e em conjunto com o gráfico acima, deixa evidente que muitas pessoas examinadas não se empenham para obter o melhor resultado, que seria o mais representativo de seu real nível intelectual.
Esse fato pode explicar inclusive uma parte do efeito Flynn, porque à medida que a qualidade de vida média das pessoas aumenta no mundo, não precisando se preocupar com comida, moradia, dívidas etc., podem se concentrar melhor nos testes, além de se sentirem mais motivadas para buscar recompensas menos fundamentais do que comida ou abrigo.
Realmente existem diferenças cognitivas em função da etnia, assim como existem em relação à altura, tamanho do pênis, concentração de melanina sob a pele etc. Todas essas diferenças existem e algumas são bastante óbvias, mas as diferenças cognitivas reais são muito menores do que Lynn tenta “vender”.
De um lado, existe o problema do igualismo ingênuo, defendido por alguns grupos, e isso não encontra nenhum respaldo nos fatos. No extremo oposto, existem os grupos de pessoas como Richard Lynn, Tatu Vanhanen e Charles Murray que tentam exacerbar as diferenças raciais e usá-las para justificar a situação de miséria de alguns povos. Tanto o grupo dos eugenistas radicais quanto o dos igualitaristas radicais estão errados, mas entre um extremo e outro existem algumas verdades.
Assim como há diferenças cognitivas marcantes entre espécies, há diferenças entre etnias, porém menos marcantes porque a amplitude de variação genética dentro de uma mesma espécie é menor do que entre diferentes espécies. Fingir que essas diferenças não existem é um erro, porque o conhecimento correto sobre as particularidades de cada etnia ajuda a fazer diagnósticos mais acurados de diversas doenças, cujos sintomas não são os mesmos em todos grupos étnicos, nem o tratamento ideal é o mesmo, o tempo adequado de exposição ao Sol para a síntese de vitamina D não é o mesmo, e muitas características que seriam interpretadas como “saudáveis” em algumas etnias não são em outras, por isso o uso correto dessas informações ajuda a interpretar com mais eficácia os resultados de hemogramas, analisar anomalias ósseas, dermatológicas e musculares. Conhecer as diferenças fisiológicas, cognitivas e comportamentais de cada etnia é importante; o problema está em usar essas diferenças com o propósito de tiranizar, oprimir ou diminuir os méritos de um povo, isso é antiético e anticientífico, e infelizmente Lynn e Vanhanen tentaram fazer isso de forma ostensiva.
Em minha entrevista no In-Sight Journal, discuto o caso específico do Brasil e o suposto QI médio 83, que consta nos estudos de Lynn. Aqui darei uma abordagem diferente da que segui naquela entrevista, para não ser redundante. A tese é a mesma, mas os argumentos e os fatos são outros.
Para começar, vamos estimar os QIs dos países a partir de estudos mais imparciais e em mais larga escala, como os exames PISA 2022 e ICI 2017.
O primeiro passo é ajustar a média de QI mundial para 100. No estudo de Lynn, a média mundial, sem ponderação é 82,03, e com ponderação é 85,08. O passo seguinte consiste em comparar os resultados do PISA com os QIs:
Nos escores mais altos, tanto de QI quanto de escore no PISA, percebe-se uma forte correlação, porém nos escores mais baixos observa-se um espalhamento imenso. Isso sugere muito fortemente que um dos escores está muito distorcido nos níveis mais baixos.
Quando comparamos QI com ICI, temos um resultado semelhante. Nos escores mais altos a correlação é forte, mas nos mais baixos há um espalhamento anormal.
Entretanto, comparando PISA com ICI, não ocorre esse problema:
Há 2 pontos anormais, muito afastados da reta de regressão, mas a grande maioria está bem agrupada perto da reta. Além disso, nos escores mais baixos o agrupamento é até mais estreito do que nos escores mais altos, ao contrário do que se observa entre QI e PISA e entre QI e ICI.
O que podemos inferir disso é que se ICI e PISA não apresentam essa variação na correlação observada entre QI e PISA e entre QI e ICI, é muito mais provável que o problema esteja nos escores de QI. Além disso, podemos constatar que o problema mais grave parece estar nos escores mais baixos. Mais adiante, apresentamos uma medida sistemática desse efeito.
Para escores acima de 25 no ICI ou acima de 1100 no PISA, ambos apresentam correlação forte com QI, mas abaixo desses escores, a dispersão cresce rapidamente e a correlação cai a perto de 0. Isso sugere que PISA e ICI são bastante satisfatórios para estimar o QI acima de 1100 e 25, respectivamente. Portanto é razoável utilizar as correlações entre QI e ICI e entre QI e PISA nos escores acima de 25 e 1100 para determinar os parâmetros da reta de regressão, e depois usar esses mesmos parâmetros para estimar o QI abaixo desses escores, na região na qual os QIs estão distorcidos.
Pode-se também usar esses parâmetros para calcular o QI a partir do ICI e do PISA nos escores mais altos, e ao fazer isso chega-se a resultados muito semelhantes aos do próprio QI. Como o PISA e o ICI são estudos mais imparciais, aplicados em amostras muito maiores e mais amplamente documentadas, provavelmente os QIs calculados dessa forma são mais próximos dos valores corretos ao longo de todo o espectro, e principalmente para ICI abaixo de 25 ou PISA abaixo de 1100, que é uma faixa na qual os QIs estimados por Lynn apresentam nítidas distorções.
Vejamos como fica a correlação removendo os outliers:
A grande maioria dos outliers provém da faixa de escores de QIs mais baixos, na qual os escores no PISA e no ICI são muito maiores do que seria esperado para aqueles supostos QIs. Quando se remove os principais outliers, o agrupamento dos pontos nas proximidades da reta é melhor no PISA, por isso ao combinar os QIs calculados a partir do PISA e do ICI foi atribuído maior peso ao PISA.
Os subtestes do PISA também apresentam forte correlação com QI, além de apresentarem forte correlação com o PISA inteiro. No caso do PISA—Ciência, a correlação é fortíssima com o PISA inteiro.
Ao estimar os QIs dessa forma, chega-se a resultados mais plausíveis. Países como Nepal e Guiné, que nos estudos de Lynn apresentam QI médio 43 e 56, respectivamente, passam a ser 93 e 89, muito mais plausíveis, consistentes com a taxa de alfabetização nesses países e com uma civilização urbana e tecnológica.
Embora o número de pessoas nas quais foram aplicados o PISA e o ICI tenha sido muito maior, o número de países nos quais foi aplicado o PISA e/ou o ICI é menor do que o número de países cujo QI foi medido ou estimado por Richard Lynn, portanto as listas do PISA e ICI são menos completas. Por outro lado, os números são muito mais realistas, mais representativos da verdadeira capacidade intelectual nesses países.
Antes de calcular os parâmetros da curva de regressão, que serviu de base para as conversões, foram removidos os países que apresentavam resultados nitidamente distorcidos na lista de Lynn e que também estavam presentes no PISA e ICI. Depois de encontrar os valores para os parâmetros da curva, esses países foram recolocados e os QIs nesses e nos demais países foram calculados.
Para estimar também os QIs dos países nos quais não foi aplicado o PISA nem o ICI, foi adotado um procedimento diferente. Primeiro foi investigado como o erro no QI de Lynn varia em função do QI, pois nos QIs mais baixos o erro é maior. Desse modo, pode-se corrigir as distorções nos QIs mesmo em países nos quais não haja informações sobre o PISA nem o ICI.
O gráfico abaixo mostra como varia o erro em função do QI, em que a diferença apresenta correlação 0,91 com o QI. Quanto menor o QI médio no país, maior é o erro cometido por Lynn. Isso facilita a correção:
Para melhorar a acurácia nos QIs onde o PISA e ICI também foram aplicados, calculamos a média entre os dois resultados, o QI convertido (H1) e o QI ajustado (H0). O resultado foi o “QI-Hb”. Por fim, a média ponderada mundial foi padronizada em 100. Com isso, chegamos a valores muito mais realistas, mais acurados, mais fidedignos para os QIs dos países. A tabela a seguir mostra os resultados encontrados:
Há outras maneiras de tratar os mesmos dados, com ponderações e ajustes mais sofisticados. Em artigo futuro, pretendo publicar uma versão aprimorada, mas num primeiro momento, essa revisão já proporciona uma estimativa muito mais consistente com os dados empíricos disponíveis.
Claro que as amostras de pessoas examinadas no PISA e no ICI podem apresentar diferenças sistemáticas das amostras examinadas nos testes de QI, e parte das diferenças pode estar associada a isso. Nesse caso, seria necessário ter acesso a mais detalhes sobre os estudos utilizados por Lynn para fazer um ajuste fino nas conversões e correções.
https://worldpopulationreview.com/country-rankings/average-iq-by-country
Se você está curioso para conhecer seu QI em comparação à média dos alunos dessas instituições, conheça nosso Sigma Test Light e nosso Sigma Test Extended. Conheça também nossos livros e artigos que abordam esse e outros temas.
Veja também:
https://www.instagram.com/hindemburg.melao/