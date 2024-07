Non. La réponse est que vous ne le savez pas. Du moins, pas avec les informations que je vous ai données.

Imaginez que ce cancer particulier est rare : une seule personne sur 1 000 en est atteinte. Vous testez 100 000 personnes au hasard. Sur ces 100 000, environ 100 auront le cancer, et votre test en détectera 99. Parmi les 99 900 restants, votre test dira correctement que 98 901 sont exempts de cancer.

Mais cela signifie qu’il dira à tort que 999 personnes ont le cancer alors qu’elles ne l’ont pas. Ainsi, sur vos 100 000 tests, 1 098 seront positifs, et seuls 99 d’entre eux seront de vrais positifs. Si vous en faites partie, il y a juste 9 % de chances que vous ayez le cancer.

Vous ne pouvez pas répondre à la question ‘Quelle est la probabilité que j’aie le cancer, étant donné ce test ?’ sans d’abord répondre à la question ‘À quel point pensais-je avoir le cancer en premier lieu ?’ C’était la grande découverte de Bayes. Vous avez besoin de ce qu’on appelle une probabilité a priori. Si le cancer était moins rare, alors votre test positif serait plus inquiétant : si une personne sur 100 en était atteinte, alors un résultat positif signifierait environ 50 % de chances d’avoir la maladie.

C’est contre-intuitif et étrange. Comment ça, ce résultat de test précis à 99 % est presque certainement faux ? Mais c’est mathématiquement inévitable.

Vous pouvez probablement voir l’incidence de ceci sur les preuves statistiques utilisées en justice. Prenez les tests ADN, par exemple : vous pourriez faire un test ADN sur un échantillon d’une scène de crime. Il correspond à un résultat dans votre base de données. Il n’y a qu’une chance sur 3 millions que l’ADN de quelqu’un corresponde à l’échantillon par hasard. Cela signifie-t-il qu’il n’y a qu’une chance sur 3 millions que votre suspect soit innocent ? Comme vous vous en rendrez compte maintenant, non, ce n’est pas le cas.

Cela dépend de votre probabilité a priori. Si votre base de données est un échantillon aléatoire de la population britannique, alors la probabilité a priori que toute personne donnée soit coupable est d’une sur 65 millions. Si vous testiez toute la population, vous obtiendriez environ 20 correspondances juste par hasard.

Mais si vous êtes un Hercule Poirot des temps modernes, et que vous ne testez que 10 personnes prises au piège par une tempête de neige dans un manoir de campagne, alors votre probabilité a priori est d’une sur 10, et la chance que ce soit un faux positif est d’environ une sur 300 000.

De vrais cas ont été décidés sur ces détails : un homme nommé Andrew Deen a été condamné pour viol en 1990 sur la base de preuves ADN pour lesquelles un témoin expert a déclaré qu’il n’y avait qu’une probabilité d’une chance sur 3 millions de correspondance. Sa condamnation a été annulée — bien qu’il ait été à nouveau reconnu coupable lors d’un nouveau procès — car un statisticien a souligné que ‘Quelle est la probabilité que l’ADN d’une personne corresponde à l’échantillon, si elle est innocente ?’ et ‘Quelle est la probabilité qu’une personne soit innocente, étant donné que son ADN correspond à l’échantillon ?’ sont des questions très différentes.

Dans le cas de Sally Clark, le problème n’était pas le test, mais le regroupement : deux événements rares se produisant simultanément. Mais, encore une fois, la probabilité de voir ces événements par hasard n’est pas la même que la probabilité qu’elle était coupable.

Le sien est loin d’être le seul cas dans lequel l’utilisation de statistiques a suscité des soupçons. En 2022, la Royal Statistical Society a rédigé un rapport sur les preuves statistiques dans les procès criminels, et a noté que l’une des raisons les plus courantes pour lesquelles les professionnels de la santé sont accusés de meurtres est parce qu’un ‘nombre apparemment inhabituel de décès survient parmi leurs patients’.

Mais ces cas sont doublement difficiles à évaluer, a noté le rapport, car ‘ils impliquent au moins deux niveaux d’incertitude’. En plus de l’incertitude normale sur le fait qu’un individu ait commis un meurtre, il y a l’incertitude sur le fait que des meurtres ont eu lieu.

L’infirmière pédiatrique néerlandaise Lucia de Berk a été condamnée, lors de deux procès en 2003 et 2004, pour sept meurtres et trois tentatives de meurtre d’enfants placés sous sa garde. Un criminologue a déclaré lors de son procès que ‘la probabilité que tant de décès surviennent pendant que de Berk était de service était seulement d’une sur 342 millions’.

Mais même si c’était le cas — et encore une fois, ce n’était pas le cas ; la RSS a estimé que si vous preniez en compte tous les facteurs pertinents, la chance de voir un regroupement comme celui-là pourrait être aussi élevée qu’une sur 25 — ce n’est pas la même chose que la chance que de Berk soit innocente. Pour établir cela, vous devriez prendre en compte la probabilité a priori qu’une personne soit un meurtrier en série — une chance heureusement minuscule. La condamnation de de Berk a été annulée en 2010, grâce en partie au travail de statisticiens avertis de Bayes.

Le raisonnement bayésien ne révèle pas seulement les condamnés à tort — dans certains cas, il aurait pu conduire à la détection des coupables. Lors du procès d’OJ Simpson pour le meurtre de sa femme et de son amie, par exemple, l’accusation a montré que Simpson avait été physiquement violent.

La défense, cependant, a soutenu que ‘un pourcentage infinitésimal – certainement moins de 1 sur 2 500 – des hommes qui giflent ou battent leurs femmes finissent par les tuer’ au cours d’une année donnée, donc ce n’était pas pertinent pour l’affaire.

Mais c’est simplement l’erreur opposée à la fallacie du procureur. La probabilité qu’un homme qui bat sa femme finisse par la tuer au cours d’une année donnée pourrait ‘seulement’ être de un sur 2 500. Mais ce n’est pas ce que nous demandons. Ce que nous voulons savoir, c’est si un homme bat sa femme, et étant donné que la femme est ensuite tuée, quelle est la chance qu’il l’ait fait?

Le spécialiste du risque Gerd Gigerenzer a tenté de répondre à cela. Le taux de base des meurtres parmi les femmes américaines est d’environ cinq pour 100 000. En supposant que la probabilité d’un sur 2 500 soit correcte, alors sur 100 000 femmes ayant des maris abusifs, environ 99 955 ne seront pas tuées. Mais des 45 restantes, 40 seront tuées par leurs maris. La probabilité correcte que le mari l’ait fait devrait être presque de 90%. La pensée bayésienne aurait pu aider à condamner Simpson.

Et bien qu’il n’utilise pas un raisonnement bayésien complet mais une version simplifiée, l’idée que nous devrions mettre à jour nos estimations de probabilité existantes avec de nouvelles informations – <a href=’https://watermark. silverchair. com/150007.

Le suivi cumulatif, plutôt que les tests ponctuels, aurait pu, selon le statisticien Professeur Sir David Spiegelhalter, repérer à la fois la catastrophe du Bristol Royal Infirmary et les meurtres du pire tueur en série de Grande-Bretagne, Harold Shipman, plus tôt, et sauver de nombreuses vies. Le cas de Lucy Letby ne repose pas uniquement sur des preuves statistiques, et je ne fais pas d’arguments sur sa culpabilité ou son innocence ici. Mais des personnes, y compris des jurys, des procureurs et des juges, ont mal compris la probabilité par le passé ; Sally Clark et Lucia de Berk ont vu leur vie ruinée par cette incompréhension. Penser comme un bayésien aurait pu aider à prévenir cela.