L'intégrité scientifique est un sujet brûlant depuis quelques années, en raison d'une prise de conscience croissante de la profession scientifique et de nouvelles normes publiques. Ce renforcement de l'intérêt pour la question de l’intégrité scientifique s'applique aussi bien aux sciences « dures » qu'aux sciences sociales, y compris à la recherche en économie et en gestion - une activité clé dans les écoles de commerce comme l'ESSEC.
Radu Vranceanu, professeur d'économie à l'ESSEC et référent à l'intégrité scientifique (RIS) à l’ESSEC, explique pourquoi l'intégrité scientifique est si importante.
En général, les chercheurs sont guidés par une forme de poursuite du bien commun. Nombre d'entre eux ont sacrifié un revenu élevé dans un emploi terre-à-terre, pour un travail avec un ‘sens supérieur’ : la quête de la vérité scientifique et son utilisation pour améliorer la condition humaine. Malgré cela, des fautes de conduite professionnelle peuvent arriver et se produisent encore. Les fautes de conduite dans la recherche scientifique sont généralement définies comme la fabrication de données, la falsification des données et le plagiat (par la NSF, cf. Schachman, 1993). Et il n'y a aucun doute à ce sujet : les chercheurs sont entièrement responsables, à titre personnel, pour toute faute de conduite.
Toutefois, l’employeur de ces chercheurs se doit également de veiller à ce qu'une culture de la fraude ne puisse pas proliférer au sein de l’organisation. Aujourd'hui, les chercheurs sont engagés dans un vrai « jeu de la publication », qui comporte des incitations à la fois positives et négatives. Les mesures bibliométriques telles que les publications et les citations constituent la nouvelle norme en matière d'évaluation des performances, favorisant une culture du « publier ou périr » où les chercheurs sont incités à publier fréquemment pour obtenir leur titularisation et des financements. Nombreux sont ceux qui seraient d'accord avec Mejlgaard et al (2020), qui soulignent que les comportements éthiquement douteux sont favorisés par « l'hyper compétitivité et la faiblesse de la formation, la dépendance inconditionnelle et inepte à l'égard des mesures d'évaluation, les biais systématiques dans l'évaluation par les pairs et la publication ». En particulier, la pression exercée sur les doctorants et les professeurs non titularisés peut provoquer une forme de désespoir à même d'alimenter les comportements professionnels contraires à l'éthique.
Parmi les cas notoires de fraude en sciences sociales, on peut mentionner Diederik Stapel, un psychologue qui a fabriqué plus de 50 études, et Eric Poehlman, un scientifique en médecine de l'université du Vermont qui a publié 10 rapports contenant des patients et des données fabriqués (Gross, 2016; Hall and Martin, 2019). Un autre psychologue, Dan Ariely, auteur d'un livre influent intitulé « The Honest Truth About Dishonesty » (l'honnête vérité sur les mensonges), avait démontré un effet de « nudge » dans un article de 2012. Récemment, un groupe de chercheurs vigilants a révélé que la conclusion de l'étude reposait sur des données fabriquées, sans que l'on sache exactement qui en est l'auteur de l’abus (The Economist, 2021).
Si ces formes de fraudes graves peuvent être détectées et sanctionnées sans remords, qu'en est-il des formes plus légères ? Il s'agit de comportements tels que le HARK-ing, ou le fait de formuler l'hypothèse à tester après avoir effectué les analyses et pris connaissance des résultats (Kerr, 1998). Pour éviter cette forme de triche, plusieurs domaines de recherche encouragent désormais les chercheurs à pré-enregistrer leur plan d'étude auprès d'une entité de dépôts avant d'entreprendre la collecte et l'analyse des données. D'un autre côté, la sérendipité existe en science, et peut mener à une innovation de rupture. Les chercheurs devraient donc être autorisés à faire état de tout résultat inattendu lorsqu’il est obtenu de manière rigoureuse.
Les revues scientifiques et les rédacteurs en chef sont clairement biaisés en faveur de résultats positifs. Cela conduit au phénomène appelé « effet tiroir » (Rosenthal, 1979), où des résultats rigoureux mais négatifs ne sont pas publiés et languissent dans le tiroir métaphorique. Que faire alors du chercheur qui « oublie » d'inclure ses résultats négatifs pour écrire ce que les éditeurs des revues académiques veulent publier ? Qu'en est-il de cet éditeur ? Décider de ne pas publier les résultats négatifs est une autre forme de manquement à la déontologie de la recherche, qui génère la duplication inutile des recherches et des manquements dans notre compréhension du monde.
Parce que les éditeurs en chef exigent des résultats positifs, certains chercheurs peuvent manipuler les données afin d'obtenir des coefficients statistiquement significatifs. Il peut s'agir d'éliminer les valeurs aberrantes sans justification, de choisir la période de temps qui minimies la valeur-p (une mesure de significativité statistique), etc. Brodeur et al (2022) ont réalisé une méta-analyse de 1 030 publications utilisant les données d'Amazon Mechanical Turk et ont constaté que la distribution statistique des z-scores présentait une densité anormalement élevée autour de 2 (le seuil de signification statistique), alors qu'elle devrait être lisse ; cela suggère un comportement de manipulation des valeurs p, difficile à détecter dans les études individuelles.
Une excellente taxonomie des fraudes en recherche dans les écoles de commerce, comprenant de nombreux exemples de fraudes graves et légères (mais toujours graves), a été élaborée par Hall et Martin (2019). Il s’agit d’une lecture incontournable pour tout doctorant en sciences de gestion.
La lutte pour les bonnes pratiques relatives à l’intégrité scientifique implique de nombreux acteurs institutionnels. En 2021, l'Union Européenne a publié une nouvelle version du Code de conduite européen pour l'intégrité en recherche (European Union, 2021). Ce code énonce quatre principes de bonne conduite universitaire :
-
“Fiabilité, autrement dit garantir la qualité de la recherche, qui transparaît dans la conception, la méthodologie, l’analyse et l’utilisation des ressources.
-
Honnêteté, autrement dit élaborer, entreprendre, évaluer, déclarer et faire connaître la recherche d’une manière transparente, juste, complète et objective.
-
Respect envers les collègues, les participants à la recherche, la société, les écosystèmes, l’héritage culturel et l’environnement.
-
Responsabilité assumée pour les activités de recherche, de l’idée à la publication, leur gestion et leur organisation, pour la formation, la supervision et le mentorat, et pour les implications plus générales de la recherche”
En France, des gouvernements successifs ont poussé à la généralisation des principes de bonne conduite. Une Charte française de déontologie de la recherche a été publiée en 2015, signée aujourd'hui par 150 établissements de recherche et d'enseignement supérieur, dont l'ESSEC. En 2017, le Ministère de l'enseignement supérieur a invité tous les établissements de recherche à mettre en œuvre une politique générale d'intégrité scientifique, comprenant des éléments de prévention, de contrôle et d'éducation. Afin de partager les meilleures pratiques en matière d'intégrité scientifique, l'Office Français d'Intégrité Scientifique (OFIS) a été créé en 2017 au sein du Haut Conseil de l'évaluation de la recherche et de l'enseignement supérieur (HCERES).
Voici quelques suggestions pour les écoles de commerce qui cherchent à promouvoir l'intégrité scientifique :
-
L’école doit organiser un flux systématique d'informations et de discussions sur ce sujet, avec la participation de la communauté des chercheurs. Les fautes déontologiques ont tendance à proliférer lorsque tout le monde considère l'intégrité scientifique comme allant de soi.
-
Un usage excessif des mesures bibliométriques (nombre de publications, citations) pour l'évaluation peut être préjudiciable ; si les mesures d’impact bibliométrique ont leur importance, la performance doit également être définie en fonction de l'innovation et de l'originalité des résultats. C'est plus facile à dire qu'à faire, mais cela mérite d'être discuté et pris en compte.
-
Financer des projets de recherche sans obligation de publication dans une revue, en fonction de l'intérêt du sujet de recherche pour la société ou les entreprises.
-
Les chercheurs devraient être récompensés même s'ils fournissent des résultats négatifs (qui risquent de ne pas être publiés par des revues, malheureusement), pour autant que ces résultats soient le fruit d'une recherche scientifique rigoureuse.
-
Un système d’aide à l’intégrité scientifique pourrait également être mis en place au niveau de l'école : par exemple, pré-enregistrer les plans d'étude, partager en libre accès les données de toutes les études empiriques, encourager les études de réplication.
Il faut reconnaître que les écarts à l'intégrité scientifique restent des cas rares. Cependant, lorsqu'ils se produisent, ils ont un fort effet d'amplification qui conduit à ébranler la confiance du public dans la science et dans les institutions de recherche. Parfois, lorsque les décideurs politiques appliquent les résultats de la recherche sans les évaluer de manière critique, cela peut même avoir des conséquences dramatiques sur la vie des gens. Cela ne laisse aucun doute: l'intégrité scientifique doit être une priorité absolue pour tous les établissements d'enseignement supérieur et de recherche.
Références
Schachman, H. K. (1993). What is misconduct in science? Science, 261(5118), 148-149.
Mejlgaard N., et al. (2020). Research integrity: nine ways to move from talk to walk. Nature. https://www.nature.com/articles/d41586-020-02847-8
Gross, C. (2016). Scientific misconduct. Annual Review of Psychology, 67.
Hall, J., & Martin B. R. (2019). Towards a taxonomy of research misconduct: The case of business school research. Research Policy, 48(2), 414-427.
A study on dishonesty was based on fraudulent data. (2021, August 20th). The Economist. https://www.economist.com/graphic-detail/2021/08/20/a-study-on-dishonesty-was-based-on-fraudulent-data
Kerr, N. L. (1998). HARKing: Hypothesizing after the results are known. Personality and Social Psychology Review, 2(3), 196-217.
Rosenthal R. (1979). The "file drawer problem" and tolerance for null results, Psychological Bulletin,86 (3), 838-641.
Brodeur, A., Cook, N., & Heyes, A. (2022). We need to talk about mechanical Turk: what 22,989 hypothesis tests tell us about publication bias and p-hacking in online experiments. SSRN. https://doi.org/10.2139/ssrn.4188289
European Union. (2021). The European Code of Conduct for Research Integrity, Revised Edition, 2021. https://www.allea.org/wp-content/uploads/2018/01/FR_ALLEA_Code_de_conduite_europeen_pour_lintegrite_en_recherche.pdf