Un de mes souvenirs les plus vifs de l’université est d’être assis dans le café de mon collège, levant les yeux de mon essai qui bégayait, et voyant les tables devant moi remplies d’étudiants de premier cycle cliquant à travers les ensembles identiques de questions à choix multiples sur leurs ordinateurs portables. L’université était une institution ancienne et vénérable, où les étudiants étaient encouragés à laisser le monde derrière eux et à se plonger dans des programmes humanistes qui remontaient à des centaines d’années. Pourtant, personne devant moi ne faisait quoi que ce soit de ce genre. Au lieu de cela, ils s’efforçaient tous de maîtriser une branche de connaissance à laquelle aucun d’eux n’avait réellement postulé : le test d’aptitude professionnelle.

Au cours des dernières années, de tels tests sont devenus inévitables pour tout professionnel en herbe. Depuis 2017, 75 des The Times Top 100 des entreprises britanniques utilisaient des évaluations psychométriques dans le cadre de leurs stratégies de recrutement, et l’année précédente, l’industrie mondiale qui conçoit, administre et entraîne ces tests était évaluée à plus de neuf milliards de dollars. Personne ne peut échapper à cela, s’il veut progresser dans le monde des cols blancs. Les étudiants universitaires dépensent régulièrement des sommes supérieures au prêt d’entretien moyen par trimestre pour des cours préparatoires sophistiqués, et les adultes en reconversion professionnelle doivent souvent prendre plusieurs jours de congé pour participer à ce que leur futur employeur a imaginé comme « suite d’évaluation ».

Les fournisseurs de ces tests semblent certainement sûrs de leur efficacité. Pearson, le leader du marché multi-milliardaire, informe les acheteurs potentiels que ces tests sont « considérés comme un outil efficace pour prédire le succès professionnel », et que « la recherche montre que les organisations peuvent prédire plus de 70 % de la performance [sic] en utilisant les bons outils ». Ces professionnels qui ont bien réussi grâce à eux sont également optimistes : « C’est essentiellement une question de logique », me dit un avocat d’entreprise. « Cela me convient, car j’ai un cerveau très logique. »

Cependant, malgré de tels témoignages convaincants, il reste remarquablement difficile d’extraire de ces tests une sorte de procédure philosophiquement robuste. Une étude sur l’un des formats de « pensée critique » les plus populaires a révélé que les candidats ayant une formation formelle en logique et en philosophie du langage pourraient en fait être à un désavantage par rapport à leurs homologues plus ignorants. Que se passe-t-il, pourrions-nous raisonnablement demander ?

Bien qu’il y ait, de nos jours, presque autant de formats de tests qu’il y a de départements RH, quelques leaders du marché clairs ont émergé. La capacité la plus largement évaluée semble être la « pensée critique » — un terme largement indéfini qui semble avoir quelque chose à voir avec la lecture de morceaux de texte et le tri des inférences valides des invalides. Au Royaume-Uni, du moins, le cadre le plus populaire est le format notoire « Watson-Glaser », qui constitue le principal critère d’entrée dans des professions comme le droit, mais qui sous-tend également de nombreux tests de raisonnement verbal utilisés dans le système éducatif, tels que les tests TSA employés par Oxford et Cambridge et le test UKCAT qui garde les portes de l’école de médecine. Il est également relativement ancien, originaire de l’ère progressiste américaine, le point culminant du réalisme racial, de l’eugénisme, de la théorie de la dégénérescence, et d’une multitude d’autres croyances désormais démodées sur la capacité de l’homme à mesurer et à taxonomiser ses semblables.

Voici une question paradigmatique du test Watson-Glaser, que j’ai adaptée du site Web de Pearson :

Énoncé : Deux cents élèves de l’école, dans leur adolescence précoce, ont assisté volontairement à une récente conférence étudiante le week-end à Leeds. Lors de cette conférence, les sujets des relations raciales et des moyens d’atteindre une paix mondiale durable ont été discutés, car ce sont des problèmes que les étudiants ont sélectionnés comme étant les plus vitaux dans le monde d’aujourd’hui.

Sur la base de l’énoncé ci-dessus, évaluez l’inférence suivante : « En tant que groupe, les étudiants qui ont assisté à cette conférence ont montré un intérêt plus marqué pour les problèmes sociaux larges que la plupart des autres personnes de leur adolescence précoce. »

A) Vrai

B) Probablement vrai

C) Données insuffisantes

D) Probablement faux

E) Faux

Selon le propre barème de notation de Pearson, cette affirmation est « probablement vraie » — « parce que, comme le sait tout le monde, la plupart des gens de leur adolescence précoce ne montrent pas autant de préoccupation sérieuse pour les problèmes sociaux larges. »

Mais est-ce un savoir commun ? Ayant moi-même travaillé dans une école, je suis frappé par le fait que, si jamais, les jeunes de ce pays sont plus attentifs aux grands problèmes sociaux que leurs aînés blasés, souvent saturés de discours politiques en ligne au point d’être carrément impossibles à éduquer. En fait, on peut faire un cas plausible que la meilleure réponse est C) Données insuffisantes, sur la base qu’il n’y a rien concernant l’intérêt des étudiants dans l’invite.

Ces questions peuvent sembler triviales, mais elles découlent d’une incohérence philosophique profonde dans tous les principaux formats de pensée critique. Les tests prétendent évaluer la capacité analytique — c’est-à-dire, la capacité à tirer des conclusions à partir de prémisses logiques, selon l’ancienne forme du syllogisme : A est B ; Tous les B sont C ; donc, A est C. Mais il n’y a pas de « probablement » dans un syllogisme. Ce qui finit par se passer, c’est que les candidats sont invités à apporter des jugements extérieurs sur la sémantique et les relations probabilistes des faits naturels dans leur réponse.

Cela soulève la question de quels critères les candidats sont censés utiliser pour faire de tels jugements. Les fournisseurs de cours préparatoires mettent en place des rubriques compliquées qu’ils prétendent aideront leurs étudiants à tout trier : « Comprendre la différence entre le savoir commun (autorisé dans la section d’inférence) » lit un guide pratique sur un site populaire appelé JobTestPrep, « et d’autres types de savoir (non autorisés) est ce qui vous permet finalement de trouver les bonnes réponses aux questions ». Ainsi, à partir du fait « Dan se tient à l’arrêt de bus », nous pouvons faire l’inférence de « savoir commun » que « il attend probablement le bus » (d’autres possibilités, comme « il se protège de la pluie » sont ici jugées folles et déraisonnables). Nous ne pouvons cependant pas inférer, à partir du fait que « Elle conduit une BMW » que « elle est probablement riche ». Ce n’est pas un « savoir commun », mais un « savoir général » — ce qui, apparemment, est une chose totalement différente. Même si nous comprenons ces distinctions, aucun barème de notation que j’ai consulté ne reconnaît que le mot « probablement » pourrait tout aussi bien désigner une incertitude sémantique qu’une incertitude épistémologique. Les candidats ayant un bagage en philosophie du langage, par exemple, percevraient probablement que des mots comme « riche » sont relatifs et dépendent du contexte ; ils seraient donc plus susceptibles d’inclure des mots de réserve comme « probablement », et ainsi tomberaient en désaccord avec le barème de notation d’une manière différente.

Dans d’autres formats de pensée critique, cette cécité à la manière dont la logique est soutenue par la sémantique produit des résultats encore plus absurdes. Considérons cette question, de la section « évaluation des arguments » du site JobTestPrep :

Évaluez la réponse à la question suivante comme FORT ou FAIBLE :

Q : Une entreprise devrait-elle accorder à ses employés un temps libre à passer comme ils le souhaitent ?

A : Non — les employés sont susceptibles d’utiliser le temps libre pour nettoyer leurs maisons, faire des courses et rencontrer des amis, et donc n’apportent aucun bénéfice à l’entreprise.

Selon JobTestPrep, c’est un argument fort. « C’est important, car cela fait référence au bénéfice que l’entreprise pourrait (ou pourrait ne pas) tirer de cette politique. » Ici, le « savoir commun » requis n’est rien de moins qu’une identification totale et sans réserve, de la part du candidat, avec l’éthique mercenaire de la société par actions. L’idée que le mot « devrait » pourrait désigner tout autre type d’obligation — morale, peut-être — est totalement inacceptable.

Les procédures sous-jacentes aux catégorisations des testeurs ne sont pas seulement difficiles à déchiffrer : elles sont complètement arbitraires. Les pauvres candidats finissent par essayer désespérément de canaliser l’esprit du test, passant d’énormes quantités de temps (et, commodément, d’argent) sur des programmes de préparation aux tests dans l’espoir d’acquérir un sens instinctif de ce que les mandarins de la mise en place des tests pensent être évident ou non. Inutile de dire que cette arbitraire encode dans les tests un immense biais culturel. Si vous venez d’un milieu similaire à celui des testeurs, alors vous réussirez probablement. Si vous avez été élevé dans un environnement différent où, par exemple, les gens sont enseignés à croire qu’ils ont des devoirs moraux qui s’étendent à la société à responsabilité limitée, vous échouerez probablement.

Encore plus révélateur, les tests d’aptitude professionnelle les plus récents et les plus brillants se passent de la déduction logique dans son ensemble, et mesurent simplement l’identification spontanée du candidat avec les rubriques officielles. Cette procédure est le cœur du « Test de jugement situationnel », ou « SJT », qui domine le recrutement dans le secteur de la santé et des ressources humaines, et constitue même une partie majeure de l’examen Fast Stream du service civil britannique. Dans le SJT, c’est le « caractère » du candidat qui est évalué, via un widget en ligne qui imagine des conflits hypothétiques en milieu de travail et demande aux candidats comment ils réagiraient. Les candidats sont exhortés à « rechercher les valeurs de l’entreprise » à l’avance — et, essentiellement, à répéter les propres politiques RH de l’entreprise.

De toute évidence, ce que cela signifie vraiment, c’est une recette parfaite pour le conservatisme au travail : l’entreprise recrute des diplômés qui font exactement ce que les procédures leur disent de faire, toujours. Ce serait une chose si la fonction publique était un modèle de maigreur, d’efficacité et d’innovation. Mais quelqu’un au Royaume-Uni pense-t-il vraiment que c’est le cas ? Incidemment, plusieurs fonctionnaires m’informent qu’à peu près personne dans la fonction publique ne croit à l’examen Fast Stream : la plupart de ces pratiques de recrutement ont été imaginées par des cabinets de conseil privés extérieurs ayant un intérêt financier évident dans la stultification de la fonction publique.

Cette mesure institutionnalisée du crâne a le potentiel de provoquer des effets catastrophiques. Il n’est un secret pour personne que le Royaume-Uni fait face à un ralentissement de la productivité, ses vastes entreprises avec leurs bureaucraties internes gonflées étant rapidement dépassées par la concurrence à l’étranger. Thomas Piketty et Katharina Pistor ont soutenu de manière convaincante que la plupart de ce qui compte pour la croissance de nos jours est en réalité une manipulation stérile de la classe administrative : changer les règles juridiques entourant ses actifs pour en augmenter la valeur, faire du lobbying pour de nouveaux schémas afin de siphonner de l’argent public vers son dernier projet startup quixotique. Brett Christophers, quant à lui, a montré comment les plus grandes et les plus rentables entreprises de nos jours sont plus intéressées par l’extraction de rentes que par la réalisation de bénéfices, précisément parce que personne ne fait ou ne crée quelque chose de nouveau ou d’assez excitant à vendre. Peu, cependant, ont noté que ce sont exactement les pathologies que nous nous attendrions à trouver en aval d’une procédure de sélection qui privilégie des candidats interchangeable et systématiquement néglige ceux qui pensent différemment. Combien des institutions sclérosées du Royaume-Uni pourraient être sauvées en intégrant des personnes capables de penser de manière critique, plutôt que des personnes qui sont douées pour la « pensée critique » ?

Lorsque j’ai soumis ces objections aux défenseurs de tels tests, la réponse est uniforme. Même si leurs méthodologies ne sont pas entièrement comprises, le site Web de Pearson rassure ses détracteurs, le fait demeure que ces tests prédissent le succès ; ils sont fortement corrélés à quelque chose appelé « résultats ». Pourtant, lorsque je regarde, il ne semble pas y avoir d’études robustes prouvant quoi que ce soit de ce genre — d’autant plus que les penseurs les plus souples et les plus intéressants ne marquent probablement pas assez bien pour obtenir des emplois en premier lieu. Quoi qu’il en soit, cette corrélation célébrée pourrait être attribuée au simple fait que les tests de « pensée critique » éliminent de manière fiable quelques candidats illettrés. Les résultats d’un test d’orthographe seraient également corrélés au succès professionnel.

Il est indéniable, étant donné les disparités raciales et sociales bien documentées dans le secteur des services professionnels au Royaume-Uni, que le préjugé manifeste en fait également partie. L’un des faits les plus étonnants concernant la littérature défendant le test Watson-Glaser est qu’elle reconnaît en réalité que c’est le cas : différents groupes culturels et ethniques tendent à obtenir des résultats très différents. Bien sûr, cela est tout à fait prévisible si la plupart de ce qui est mesuré est la proximité culturelle du candidat par rapport à l’organisateur du test ; les grands prêtres de la psychométrie, cependant, restent déterminés à trouver un moyen de rendre leur discipline compatible avec l’éthique égalitaire du département des ressources humaines moyen. Un rapport du Imperial College London admet que « la propre littérature de Pearson Vue sur l’évaluation de la pensée critique Watson Glaser rapporte… que l’ethnicité a été précédemment associée à des performances de groupe différentielles au test », pour ensuite observer qu’« il n’y avait pas de différence entre les groupes lors de la prédiction de la progression [de carrière] ». Ainsi, le rapport conclut que le terrain de jeu peut être nivelé grâce à diverses initiatives DEI baroques. En d’autres termes : oui, les tests semblent être biaisés racialement, mais vous n’avez pas à vous inquiéter car les tests ne fonctionnent pas réellement, donc vous pouvez imposer les quotas que vous souhaitez au nom de la conformité sans vous sentir trop coupable. Il est pratique de noter que la plupart des entreprises qui vendent des suites d’évaluation professionnelle semblent également proposer des services « d’égalité et de diversité ».

En fin de compte, les évaluateurs professionnels sont coupables de commettre non pas une, mais deux des grandes erreurs philosophiques de notre époque. Premièrement, ils confondent le fait que les tests donnent des résultats quantifiables avec l’idée que ces résultats sont d’une manière ou d’une autre objectifs. Deuxièmement, ils supposent que les faits sur le monde peuvent être dérivés d’une logique pure, sans qu’aucune théorie de la sémantique n’intervienne. Ces hypothèses sont omniprésentes dans la culture de nos jours, animant tout le monde, des fétichistes du QI en ligne aux technocrates ternes qui pensent que tout peut être résolu avec une bonne dose d’économie réparatrice. Quiconque a une once de formation philosophique sait assez pour les remettre en question — en effet, si l’on retrace la généalogie de la pensée « critique » assez loin, on arrive au travail d’Immanuel Kant, dont l’ensemble du projet philosophique visait à montrer comment le raisonnement « pur » ou « logique » est toujours infecté par des structures a priori qu’il ne peut lui-même justifier.

Malheureusement, cependant, les sciences humaines académiques comme la philosophie semblent être le type de discipline que les employeurs sont déterminés à ne pas prendre en compte dans leurs procédures de recrutement. C’est dommage : dans une mesure sans précédent parmi les branches de la connaissance humaine, les sciences humaines impliquent un questionnement des catégories abstraites et des systèmes de mesure par lesquels nous analysons et comprenons le monde, et une réflexion sur la question de savoir si les questions que nous posons dans nos poursuites plus banales et techniques sont même les bonnes questions. Elles sont donc l’antidote parfait à l’ineptie procédurale, à la bureaucratie engorgée, au sentiment de stagnation qui hantent le lieu de travail contemporain. Si les gens veulent vraiment galvaniser une organisation, ils devraient commencer à essayer de redécouvrir un peu de cet esprit critique et humaniste, et se débarrasser de la solution brute que le dernier consultant mielleux leur a vendue. Laissez de côté Watson et Glaser ; engagez plutôt quelques spécialistes de Kant. Peut-être qu’un jour, les étudiants dans les cafés universitaires comme le mien pourront fermer leur logiciel de préparation aux tests et retourner dans les bibliothèques où ils appartiennent.