Recorrentemente, os meios de comunicação veiculam os argumentos defendidos por políticos, especialistas, cientistas e órgãos de referência para que suas considerações sejam observadas pela população.
Curiosamente, tais argumentos não parecem se aproximar de uma razão comum e, desse modo, as perspectivas de cada parte duelam no entorno da racionalidade como se, de outra sorte, fossem irracionais.
Mas o que é a racionalidade? Conforme as referências do cientista cognitivo Steven Pinker, incluem-se em tal concepção os modelos normativos (como devemos pensar), a filosofia, a lógica, a probabilidade e a estatística. É preciso considerar ainda os diferentes modos da racionalidade: razão dedutiva (causalidade), razão probabilística (correlação), razão motivada (conduzir o raciocínio na direção que favorece a conclusão), viés de autofavorecimento (na direção que favorece nossas crenças ou nossos interesses) e razão expressiva (que valoriza o que somos).
Não é de estranhar que alguns desses modos sustentem muitas das perspectivas dos porta-vozes que defendem essa ou aquela posição sobre o Covid-19. E a fragilidade ou a confusão que constatamos advém de algo que os psicólogos denominam viés de confirmação, ou seja, as pessoas costuma procurar evidências que confirmem suas hipóteses, e não aquelas que as falsifiquem ou as refutem.
Como podemos ser mais racionais quando se trata de observar as tendências do Covid-19, tanto no quesito infectocontagioso quanto nos aspectos do seu tratamento e desdobramentos de cura ou óbitos?
Um grupo de cientistas de dados brasileiros, liderado pelo engenheiro e especialista em marketing Rui Bueno, que há mais de 16 anos atua na área de advanced analytics, tratou de refinar modelos epidemiológicos, utilizando inteligência artificial e técnicas de machine learning (ML). O estudo, publicado no fim de abril, demonstra como a interpretação dos vieses na modelagem analítica ajusta a nossa razão para bem ponderar nossas conclusões, opiniões e hipóteses.
O gráfico 1, por exemplo, compara as métricas nominais de casos confirmados de infecção e óbitos na América Latina com a medida relativa dessas duas variáveis em relação à totalidade da população, categorizando, assim, dez países sul-americanos em cada uma das visões. A análise desenvolvida pelo cientista Deivison Macedo, mestre em big data analytics e bacharel em engenharia da computação, visa esclarecer a perspectiva de que, apesar de a medida nominal de casos e óbitos colocar o Brasil no topo do ranking, quando se compara a medida relativa em relação à população o Brasil cede posição ao Equador.
Gráfico 1 (Deivison Macedo)
O aspecto a notar é que tal análise não é conclusiva, ela permite levantar novas hipóteses, como explica o próprio Macedo: “Até que ponto a extensão territorial do Brasil não influencia essa medida relativa? Haveria influências do padrão econômico de cada país? E quanto à disponibilidade de recursos de saúde pública?”
Outra análise muito interessante, apresentada no gráfico 2, advém da cientista Mariana Fontanezi, estatística pós-graduada em data science e engenharia de produção. Fontanezi adotou um conceito denominado “vida pandêmica”, que consiste na observação dos dados sobre os óbitos sem levar em conta o calendário. A análise foi enriquecida a partir de técnicas de clusterização da idade pandêmica e teve como base o primeiro caso reportado em alguns países para caracterizar ciclos comparáveis da eficiência dos esforços desses países na recuperação da infecção.
Gráfico 2 (Mariana Fontanezi) As curvas demonstram que, enquanto a Itália enfrentou dificuldades para conter os óbitos a partir do 40º dia, a Espanha encontraria a mesma situação depois do 50º, e os EUA depois do 60º dia.
Novamente, tal análise propõe questões diferentes, como as sugeridas por Fontanezi: “Haveria alguma relação com a determinação dos respectivos governos em exigir mais cedo a reclusão da população? Estaria o sistema de saúde de cada país capacitado para atender e tratar a população com o quadro sintomático do vírus?” Tais perguntas fomentam novas hipóteses, não há dúvida.
Já a cientista Lívia Moraes, bacharel em estatística e pós-graduada em produtos financeiros e gestão de riscos, pautou suas análises usando técnicas de machine learning. Sua investigação tomou como fundamento preliminar as curvas de diversos países. O objetivo foi a clusterização por severidade, visando identificar alguma similaridade com o Brasil. Ela ainda propôs outra clusterização, por estados brasileiros, observando a incidência do vírus e a taxa de letalidade.
Os gráficos publicados por Moraes, diferentemente dos apresentados por Fontanezi e Macedo, associados à visão descritiva dos dados, constituem uma análise preditiva, usando séries históricas para subsidiar instrumentos de forecast. O gráfico 3-A relaciona a taxa de crescimento de casos brasileiros com outros países, considerando o peso do isolamento social. Já o gráfico 3-B toma por base um modelo de ML inicialmente treinado pelos dados da Itália, mas, com o descolamento das curvas, os dados dos Estados Unidos foram incluídos. O último gráfico, 3-C, efetua a projeção comparativa que contempla os efeitos do isolamento social em comparação com a situação sem isolamento.
Gráfico 3-A Gráfico 3-B Gráfico 3-C (Livia Moraes)
A análise preditiva permite a reconsideração das hipóteses contrárias e favoráveis ao isolamento social, suscitando questões amplas sobre as características comparativas das curvas.
A partir de dados do Datasus, a cientista Aline Riquetti, bacharel em estatística com especialização em business intelligence e professora de pós-gradução do IESB, buscou avaliar a situação dos municípios brasileiros na resposta à pandemia. Ela avaliou a disponibilidade de profissionais de saúde, leitos e equipamentos hospitalares, visando à comparação com os casos confirmados.
A análise preditiva de Riquetti, baseada nos modelos epidemiológicos, permite antever quais regiões ou municípios do estado de São Paulo vão carecer de recursos diante das curvas de infecção, conforme o gráfico 4.
Gráfico 4 (Aline Riquetti)
Com efeito, os modelos descritivos e preditivos em muito contribuem para que as hipóteses aventadas por conta da crise encontrem nas trilhas analíticas a fundamentação para o processo decisório propiciado pelas rodovias dedutivas. Imagine, então, o poder de modelos prescritivos.
O exemplo das decisões ajustadas pela predição baseada em dados pode ser entendido a partir do estudo do cientista Victor Rodrigues, bacharel em engenharia eletrônica e pós-graduado em data analysis e data mining. A partir dos dados oriundos de 5.600 atendimentos realizados pelo Hospital Albert Einstein e publicados anonimizados pelo hospital em um convite-desafio a cientistas de dados de todo o País, Rodrigues se baseou em recursos de IA para construir um modelo para auxiliar médicos no processo de triagem de pacientes com suspeita de Covid-19.
A acurácia do modelo de Rodrigues mostrou-se bastante compatível com a dos testes rápidos disponibilizados em laboratórios e farmácias. O modelo – uma árvore de decisão – baseia-se nos hemogramas dos pacientes, correlacionando variáveis como quantidade de leucócitos, hematócitos, etc. (vide gráfico 5).
Gráfico 5 (Victor Rodrigues)
O modelo que correlaciona os diferentes resultados de cada indicador dos hemogramas, avaliando assim a presença do vírus, poderia, eventualmente, ser usado como base prescritiva no tratamento do paciente, se houvesse respaldo na literatura médica. Por exemplo, as decisões sobre quais medicamentos poderiam colaborar no ajuste desses indicadores iriam nutrir-se, nesse caso, de recomendações dos modelos de IA, facilitando a ação dos médicos.
Todos os exemplos acima correspondem ao valor da racionalidade de cunho probabilístico e estatístico. É uma simples demonstração de que propor hipóteses, como todas essas que ora são veiculadas pela mídia, originadas das opiniões de diferentes personalidades, é muito fácil. A dedução encontra substrato quando as correlações esclarecem as fragilidades ou a consistência da nossa racionalidade.
A verdade é que a grande maioria de nós não se engaja em testar as próprias hipóteses antes de assumi-las como prováveis ou possíveis. Considere ainda outro aspecto muito peculiar: frequentemente, os tomadores de decisão abandonam as hipóteses iniciais em favor de novas hipóteses mesmo que se possa aprender alguma coisa a partir das primeiras. E isso não nos dá mais conhecimento para aumentar as probabilidades de que estamos no caminho certo.
Não podemos nos esquecer de que, às vezes, temos acesso a evidências que não dispõem de hipóteses que as sustentem, assim como sugerimos hipóteses que precisam de evidências para confirmá-las ou refutá-las. Contudo, a expressão da sustentabilidade das hipóteses está na mitigação dos vieses dos testes evidenciadores dessas hipóteses. Tal disciplina e organização de ideias não exigem apenas a nossa racionalidade, mas sobretudo a nossa atenção para o caráter ilusionista de uma razão comprometida com algo além dela mesma.
É possível que nossa tibieza racional diante de razão motivada ou autofavorecimento, ou ainda de razão que não entende a relação entre correlação e causalidade, seja o que corresponde às fábulas que ouvimos por aí. Como, então, constatar a realidade? Em que análise ela se deixa ver, ainda que pelas frestas? Talvez a real história sobre o Covid-19 esteja nos rastros significativos deixados pelos dados da pandemia. Mas não podemos assumir nada sem antes enveredarmos pelas trilhas analíticas. Afinal, se acreditarmos que andar em alta velocidade nas rodovias dedutivas resolverá o problema da realidade do vírus, haverá muitas vítimas desavisadas que serão atropeladas pelos efeitos da doença.