As contribuições de Thomas Bayes para a humanidade perduram por séculos. Importantes aplicações de machine learning usam exaustivamente ferramentas como o "Algoritmo de Monte Carlo" , da cadeia de Markov, que por sua vez fazem uso da inferência bayesiana.
Pouco depois do início do surto de COVID-19, logo quando a ANVISA autorizou os primeiros métodos de testagem para a doença, uma amiga apresentou alguns sintomas e decidiu fazer o teste. O resultado foi positivo. É claro que ela não me informara do incidente nem de longe com alguma calmaria, muito porque não se sabia, na época, o que esperar da doença. Meu papel de amigo foi tentar tranquilizá-la na medida do possível, apresentando formas verossímeis de pensamento para que ela não se sentisse em xeque. Pedi-lhe que me informasse qual a acurácia - ou sensibilidade, característica de todo exame de caráter não-determinístico que indica o nível de confiança na crença em seu resultado - do exame que fizera, visto que esta varia muito, em particular nos primeiros exames realizados no Brasil. Só para se ter uma ideia, um estudo posterior da ANVISA deu conta de que a acurácia dos diversos tipos de testes praticados no Brasil variava de 70% a 100%, a depender do método. Como a ideia deste escrito não é discorrer sobre biomedicina, foquemos nos fatos: o exame realizado apresentava acurácia de 86% nas condições em que fora efetuado. Sejamos francos: se você estivesse no lugar de minha amiga, certamente teria a falsa crença de que você muito provavelmente estaria, sim, com a COVID-19. Eu, como seu amigo, ponderaria: a probabilidade de você estar com a doença é (muito) menor do que isso! Na verdade, para ser bem pessimista, eu diria que as chances são inferiores a 20%! Se estiver embasbacado, garanto que você entenderá o cálculo que eu fiz antes mesmo de você precisar ver a fórmula, mas ainda assim, eu a mostrarei. Adiante.
Para facilitar a elucidação, tomemos um exemplo bastante simples de uma modelagem matemática envolvendo números mais intuitivos. Faça o seguinte exercício mental: suponha que existe uma doença rara que, estatisticamente (de caráter empírico, é o que quero dizer) atinge 1% da população mundial. Você faz um teste não-determinístico que tem acurácia de 99% e ele dá positivo. Qual a conclusão? Que você está com a doença, certo? Bem, na verdade esta conclusão é deveras precipitada, porque você está exatamente lidando com 50% para sim e 50% para não. Você dirá: "Como assim, Nando? Tu bebeste? O meu exame tem acurácia de 99%, eu estou em apuros!"
Vejamos. Voltemos uma casa. Não foi por acaso que eu escolhi os números 99% e 1% neste exercício, foi para facilitar o entendimento. E, para facilitar ainda mais, irei ilustrar a situação. Observe, na tira particionada em cem tiras menores, que cada retângulo representa uma pessoa em um grupo de cem:
Confie em mim: são cem tirinhas.
Voltemos mais uma casa. O que é acurácia? De acordo com o dicionário Oxford Languages, as definições de acurácia são:
1. proximidade entre o valor obtido experimentalmente e o valor verdadeiro na medição de uma grandeza física.2. precisão de uma tabela ou de uma operação.
Portanto, se temos um exame com 99% de acurácia, significa que em 99% dos casos ele estará certo e em 1% ele estará redondamente errado. Em outras palavras, ao aplicar o exame em cada pessoa representada na imagem acima, haverá uma pessoa - independentemente dela ser saudável ou não - cujo resultado do teste será falso. Também precisamos levar em conta que, já que a doença atinge 1% da população, há uma pessoa que de fato está doente e ela precisa ser representada. Na imagem, a pessoa com o resultado falso está demarcada em verde e a pessoa que de fato está doente ficou demarcada em vermelho. Nesta situação, para satisfazer simultaneamente a acurácia de 99% do exame e a taxa de 1% de incidência da doença, obrigatoriamente deve haver somente um resultado falso (positivo ou negativo) e 99 resultados corretos - repare que não importa se o resultado do exame é positivo ou negativo, mas sim se ele acertou ou errou -, então, por óbvio, vislumbrar-se-á somente as seguintes situações admissíveis:
1) a pessoa que está doente testou positivo (resultado correto) e uma dentre as 99 saudáveis testou positivo (resultado falso-positivo);
2) a pessoa que está doente testou negativo (resultado falso-negativo) e as 99 saudáveis testaram negativo (resultado correto).
Note que não existe a possibilidade de qualquer número de pessoas maior do que dois testar positivo, porque isso implicaria no exame errar em mais de 1%. E eu vou insistir: se há 1% de infectados pela doença, existe apenas um infectado no grupo. Portanto, o resumo da ópera: se você tem uma doença que afeta 1% da população e faz um exame com acurácia de 99% que dá positivo, suas chances de realmente estar com a doença são de 50%. Se duvida, experimente pensar assim: no grupo, há alguém infectado e também há alguém segurando um exame com resultado falso. Se o meu exame deu positivo, então eu só posso ter duas opções: ser a pessoa infectada ou ser a pessoa segurando o exame com resultado falso. É prudente presumir 50% de chance para cada opção, não é?
Saindo do exercício mental, voltemos ao caso real. Na época em que minha amiga estava com suspeita de estar doente, os dados oficiais eram:
4.623 infectados;
230.000 habitantes;
86% de acurácia do exame;
2,01% de pessoas infectadas.
Nota: o valor de 2,01% de pessoas infectadas foi calculado a partir do número total de habitantes da região e do número oficial de infectados.
Aplicando a mesma lógica que aplicamos em nosso exercício mental nos dados empíricos, concluímos que minha amiga tinha apenas 11,14% de probabilidade de estar com a doença, a menos que repetisse o exame, como veremos. Neste caso, as coisas mudariam drasticamente, mas vamos primeiro dar uma olhada no Teorema de Bayes: Este teorema não é determinístico, assim como a acurácia dos exames de certos tipos - incluindo o supra - não são determinísticos. Você deve fazê-los e repeti-los diversas vezes se quiser que seu nível de confiança neles chegue perto de 100%. Vamos interpretar, calma e tranquilamente, cada objeto do teorema:
Primeiro, analisemos eventos independentes:
A: a probabilidade da doença ocorrer, que neste caso é de 2%;
B: a probabilidade de testar positivo.
No teorema, a probabilidade de testar positivo se relaciona intimamente com o resultado do exame. Vejamos:
P(A|B): A probabilidade de A ser verdadeiro, desde que B seja verdadeiro. Em outras palavras, a probabilidade de estar doente, já que o exame deu positivo. É exatamente o que estamos procurando saber;
P(B|A): A probabilidade de B ser verdadeiro, desde que A seja verdadeiro. É a medição de um positivo detectado corretamente, ou quando o exame acerta, é o que quero dizer.
Agora, atenção: um teste pode dar positivo se a pessoa estiver doente e também pode dar positivo se ela não estiver, situação em que ele é qualificado como falso-positivo. Importante ter isto em mente, porque precisaremos calcular essas chances antes de jogá-las no teorema. Elas dependerão diretamente da acurácia do exame e da probabilidade da doença ocorrer. Assim, calcularemos ambos os cenários, e os somaremos. Chegamos à conclusão que:
P(B) = P(B|A)P(A) + P(B|Â)P(Â). Nesta expressão, os acentos circunflexos em "Â" indicam a negação do evento, isto é, o cenário em que A não está ocorrendo. É o falso-positivo. Assim, o teorema também pode ser escrito da seguinte forma:
Finalmente, ao aplicarmos todas as informações na fórmula mágica, teremos isto:
Chegamos aos 11,14%. Já que este é um nível de confiança muito baixo para se ter num exame, eu apostei que quando o teste fosse reaplicado, ele daria negativo (afinal, eu tinha mais de 88% a meu favor nessa aposta), o que de fato ocorreu. Ao reaplicar o exame, não se deverá mais ponderar com base em 2% da população infectada, mas sim, com os 11,14% de probabilidade. Por quê? Porque 11,14% passa a ser a nova probabilidade de ser afetado pela doença, já que o primeiro resultado acaba de ponderar: a) a acurácia do exame; b) a taxa de infecção da doença na sua região e c) o simples fato de seu exame ter testado positivo. Ao fazer isto, você terá uma confiança consideravelmente maior: 43% ainda é uma confiança bastante baixa, mas perto dos patéticos 11,14%, eu diria que trata-se de uma melhora abrupta. Se você aplicar o exame pela terceira vez, verá que o próximo terá uma confiança de mais de 82%. Agora, voltemos umas casas e hipoteticamente façamos de conta que minha querida amiga estava quase sob as mesmas condições, exceto pelo fato de que fez um teste que tinha 99% de acurácia: Muito próximo de 67%. O que achou? Aumentamos a acurácia do exame em apenas 13% e atingimos um nível de confiança seis vezes maior frente ao primeiro resultado. Se minha amiga tivesse feito um exame com 99% de acurácia, eu teria tido muito mais dificuldade em tranquilizá-la caso desse positivo. Interessante notar que a esmagadora maioria das pessoas não se preocupa com este tipo de informação. Considero isso tanto uma falha de comunicação, como de lógica: se você faz um exame porque quer saber se você tem o que acha que tem, é racional questionar ao menos o nível de confiança do exame. Do contrário, o que você tem é uma ilusão.
Para este escrito, é só! Agradeço você, estimado leitor, pela paciência.