OSEC 2022 : la science ouverte à l’heure européenne

Institutionnel

L’Appel de Paris appelle à réformer les pratiques d’évaluation de la recherche. Il a été présenté lors des Journées européennes de la science ouverte (OSEC 2022) des 4 et 5 février 2022 organisées dans le cadre de la présidence française du Conseil de l’Union européenne, qui ont vu aussi la remise des premiers prix Science ouverte.

« En 2022, la France souhaite s’inscrire dans le mouvement de la science ouverte et renforcer la dynamique internationale, en lui donnant un nouveau souffle », affirme Marin Dacos, coordinateur national de la science ouverte rattaché au Ministère de l’Enseignement supérieur, de la Recherche et de l’Innovation (Mesri). Avec plus de 2000 participants du monde entier rassemblés en ligne, les Journées européennes de la science ouverte1  (OSEC 2022) des 4 et 5 février en témoignent, avec la présentation de l’Appel de Paris pour une réforme de l’évaluation de la recherche et la première édition des prix Science ouverte. Ces Journées inaugurent la dizaine d’événements organisés par le CNRS et ses partenaires, et labellisés par le Mesri dans le cadre de la présidence française du Conseil de l’Union européenne (PFUE).

  • 1Open Science European Conference, en partenariat avec le Mesri, le CNRS, l'Académie des sciences, l’Inserm, le Haut conseil de l’évaluation de la recherche et de l’enseignement supérieur (Hcéres), l’Agence nationale de la recherche (ANR) et les universités de Lorraine et de Nantes.

La science ouverte, c'est-à-dire l’ouverture de processus de recherche dans ses aspects variés, représente un enjeu de transparence, de reproductibilité et de rayonnement de la recherche, au bénéfice de son accélération, de sa démocratisation et du développement de sa fiabilité et des collaborations. Elle met en jeu des questions de puissance nationale et européenne et représente une priorité de l’Europe, de la France (avec le Plan national pour la science ouverte en 2018, annoncé par la ministre Frédérique Vidal et mis à jour en 2021) et du CNRS (avec sa feuille de route lancée en 2019), en lien avec ses partenaires du G62 .

« Les enjeux dépassent le périmètre national et européen », a aussi indiqué Antoine Petit, président-directeur général du CNRS lors de l’inauguration de l’événement. D’envergure mondiale, cet événement a vu des interventions remarquées d’importantes personnalités du monde de la recherche, comme Mariya Gabriel, commissaire européenne à l’innovation, la recherche, la culture, l’éducation et la jeunesse, ou Maria Leptin, nouvelle présidente de l’European Research Council (ERC), et du côté français, la ministre Frédérique Vidal ou la directrice générale de la recherche et de l’innovation Claire Giry au Mesri. L’Unesco et des universités américaines, mexicaines ou d’Argentine étaient également représentées.

L’Appel de Paris pour une meilleure évaluation de la recherche

Développée d’abord par les scientifiques eux-mêmes depuis les années 90, la science ouverte s’inscrit peu à peu dans les politiques publiques partout dans le monde depuis les années 2010. En 2012, la Commission européenne publie ainsi ses recommandations « relatives à l'accès aux informations scientifiques et à leur conservation ». En 2013, la Déclaration de San-Francisco sur l'évaluation de la recherche (DORA) remet en cause la corrélation assumée entre renommée d’une revue et qualité de la contribution d’un scientifique qui y publie. Lors de la présidence néerlandaise du Conseil de l’UE en 2016, l’appel d'Amsterdam propose 12 actions pour permettre l’accès aux publications et données scientifiques issues de recherches financées par des fonds publics, la même année que la loi française pour une République numérique. Fin 2021, le premier cadre international sur la science ouverte est adopté par les 193 pays participant à la Conférence générale de l’Unesco.

  • 2Le réseau G6 regroupe les principaux organismes pluridisciplinaires de recherche européens – CNR (Italie), CNRS (France), CSIC (Espagne), Helmholtz Association, Leibniz Association et Max Planck Society (Allemagne) – et représente 135 000 collaborateurs.

La science ouverte progresse en France

Selon le nouvelle édition du baromètre de la science ouverte française publiée le 28 janvier 2022, 62 % des 166 000 publications scientifiques françaises publiées en 2020 sont en accès ouvert en décembre 2021, soit une progression de 10 points en un an similaire à la progression observée pour les publications scientifiques de 2020 issues des unités du CNRS qui passe à près de 80 % d’accès ouvert. 46 % de ces publications françaises, et même 68% de celles du CNRS,sont disponibles sur une archive ouverte comme HAL1 . Accueillant toutes les disciplines, cette dernière reste la principale archive ouverte utilisée pour les publications françaises devant PubMed Central (biomédecine), arXiv (physique, mathématiques et informatique) et bioRxiv (biologie). Malgré des différences marquées entre disciplines, toutes progressent sur l’ouverture des publications. Pour la première fois, le baromètre comprenait un volet centré sur la recherche en santé et fournit en particulier de nombreux indicateurs sur l’enregistrement des essais cliniques et de leurs résultats.

En savoir plus : Baromètre de la science ouverte

  • 1Développée par le Centre pour la communication scientifique directe (CNRS/Inria/Inrae).

La nouvelle étape prend alors la forme de l’Appel de Paris, lancé par le Comité pour la science ouverte quelques jours avant les Journées OSEC 2022 et qui suit l'Appel à manifestation d'intérêt de la Commission Européenne rassemblant déjà plus de 160 signatures : la France invite les institutions à rejoindre une coalition d’acteurs de la recherche européenne qui s’engagent à mettre en œuvre des « transformations opérationnelles, réciproques et lisibles » dans leurs pratiques d’évaluation, afin de les rendre plus justes et transparentes, et de reconnaître davantage la qualité de la recherche, dans toute sa diversité, plutôt que la quantité de publications. L’évaluation de la recherche est en effet « le plus grand défi de la science ouverte, capital à son développement et à son ancrage au sein des établissements de recherche », selon Jean-Éric Paquet, directeur général de la recherche et de l’innovation à la Commission européenne, qui a participé avec plusieurs dirigeants européens à une table ronde sur le sujet, placé au cœur de l’OSEC 2022.

Les multiples questions autour de l’évolution de cette évaluation dans plusieurs disciplines et divers cadres ont ainsi occupé une bonne partie des deux journées de l’événement. Il s’agissait de montrer que le système d’évaluation doit pouvoir s’adapter à tous les niveaux et encourager les bonnes pratiques de la science ouverte, avec des règles cohérentes et partagées, explique Sylvie Rousset, directrice des données ouvertes de la recherche au CNRS, qui organisait les Journées OSEC 2022 pour l’organisme.

Prendre en compte l’importance du travail des scientifiques pour publier en accès ouvert mais aussi rendre leurs données accessibles, concevoir et maintenir des logiciels, rendre disponibles les résultats négatifs, etc. sont ainsi indispensables. Moteur de la thématique, le CNRS a d’ailleurs inscrit l’évaluation comme l’un des 4 piliers fondamentaux de sa feuille de route pour la science ouverte. Il s’associe donc « pleinement » à cet Appel de Paris, assure Sylvie Rousset. « On ne peut pas faire de la science ouverte sans articuler l’évaluation de la recherche à toutes les échelles, locale, nationale, européenne et internationale », insiste-t-elle, comme l’ont montré les différents témoignages pendant les deux jours OSEC 2022.

Promouvoir la bibliodiversité

Dans une autre session, l’avenir de l’édition scientifique a aussi été discuté. Enjeu d’ampleur mondiale pour le partage des connaissances, il semble s’orienter vers une cohabitation de plusieurs voies d’accès à la publication en accès libre – ce que le Plan national pour la science ouverte appelle la « bibliodiversité » : prépublications dont la crise du Covid-19 a bien montré l’intérêt et les limites, archives ouvertes (comme HAL, développée en France, qui vient de fêter ses 20 ans), avec ou sans revue par les pairs intégrée ou externe, ou encore publications chez des éditeurs scientifiques avec plusieurs modèles, dont l’édition diamant3 . « Il y a besoin de finesse et d’équilibre », prône Marin Dacos, en s’adaptant aux besoins et cultures des différentes disciplines et en faisant en sorte que les inconvénients de certaines voies soient compensées par d’autres, comme l’ont montré les intervenants.

Enfin, deux sessions sur des thématiques plus resserrées formaient l’introduction et la conclusion des Journées. La première était centrée sur une discipline particulière, la santé, un « condensé d’enjeux sociétaux, sanitaires et économiques majeurs » selon Marin Dacos. Le but : ancrer le débat dans un cas d’usage concret de la science ouverte, pour en démontrer l’intérêt à la fois pour la recherche et pour la société. En effet, pour des raisons « évidentes et légitimes », liées au caractère sensible et privé des données individuelles, la santé partage peu ses données aujourd’hui. Pourtant, ces données sont indispensables au développement de traitements et politiques de santé, comme l’a bien montré la pandémie de Covid-19. La science ouverte dans ce domaine s’oriente donc plus vers un partage sous contrôle et la possibilité de rendre fiables les circuits de données, plutôt qu’une ouverture large et totale. Des outils sont par exemple développés pour aider les scientifiques à rendre compte de leurs recherches de façon plus fiable et accessible. Les résultats négatifs doivent aussi être davantage publiés.

Ouvrir tous les produits de la recherche

La dernière session des Journées s’intéressait, quant à elle, à un « grand oublié des politiques de la science ouverte jusque-là » : le logiciel de recherche. Brique essentielle permettant de passer de données à une connaissance, le logiciel reste un produit de la recherche invisibilisé, sa maintenance, citation et reconnaissance étant inégales. Pour y remédier, « il faut commencer à instruire ce dossier en profondeur », explique Marin Dacos, en ne considérant pas le logiciel comme une simple donnée et en prenant en compte le travail que cela demande et les spécificités disciplinaires, sans exclure une exploitation commerciale de certains logiciels. Le second Plan national pour la science ouverte français 2021-2024, porté par la ministre Frédérique Vidal, s’y attache et le CNRS soutient le développement de l’archive ouverte et pérenne du logiciel libre, Software Heritage.

Pour reconnaître la valeur et la contribution des logiciels à la science, les Prix de la science ouverte, remis pour la première fois lors de l’événement, les ont mis à l'honneur, une première mondiale pour ce type de contribution de la recherche. Sur près de 130 candidatures, le jury présidé par Daniel Le Berre, médaille de l’innovation du CNRS 2018 pour un logiciel de recherche très utilisé par l’industrie, a récompensé quatre logiciels, avec une mention spéciale (accessit) pour six autres (voir encadré). Plusieurs lauréats éclairent la porosité entre monde de la recherche et monde socio-économique, rendue possible si les logiciels de recherche sont libres et ouverts.

Suivant la célèbre métaphore, Marin Dacos conclut : « La science ouverte fait en sorte que les scientifiques puissent vraiment s’asseoir sur les épaules des géants qui les ont précédés, des épaules stables et complètes grâce à la prise en compte des publications mais aussi des données et des logiciels. » Cependant, « il reste beaucoup à faire », reconnaît-il, citant toutes les formes de résultats de la recherche encore peu reconnues, mais « la PFUE aura donné une nouvelle énergie au mouvement pour induire ces transformations indispensables dans tout l’écosystème de recherche ».

  • 3Les revues « diamant » en accès ouvert  proposent une évaluation par les pairs sans coût direct pour les auteurs et les lecteurs. Un symposium dédié a eu lieu le 2 février en amont des OSEC 2022.

Les prix science ouverte 2022

Inscrits dans le deuxième Plan national pour la science ouverte du Mesri et remis pour la première fois en 2022, les prix science ouverte « données de la recherche » et « logiciel libre de la recherche » récompensent des initiatives emblématiques en la matière. Si les prix « logiciel libre » ont été dévoilés à l’OSEC 2022, le volet « données de la recherche » de ces Prix, reconnaissant « l’exemplarité et le caractère novateur » de pratiques mises en œuvre en matière de préparation et de réutilisation de tout type de données, présentera ses lauréats et lauréates à l’été 2023. Un prix de thèse sera également lancé en 2023.

Les 4 lauréats des prix
Les prix science ouverte logiciel libre ont récompensé des logiciels représentés par Gaël Varoquaux, Théo Zimmermann, Stéphane Letz et Bruno Khélifi (de gauche à droite). © OSEC 2022

Prix science ouverte logiciel libre

  • catégorie scientifique et technique :
    • L’assistant de preuve Coq, développé chez Inria depuis 1984 pour écrire et vérifier des preuves mathématiques, et sa communauté créée notamment pour assurer la maintenance à long terme et l’évolution progressive du logiciel – représenté par Théo Zimmermann de l’Institut de recherche en informatique fondamentale (CNRS/Université de Paris)
    • Mention spéciale au logiciel Coriolis de conception assistée par ordinateur pour l'électronique sur silicium, en particulier pour le « placement-routage », c’est-à-dire le placement et la connexion automatiques des différentes parties d'un circuit électronique en fonction du programme visé – représenté par Jean-Paul Chaput du LIP6 (CNRS/Sorbonne Université)
  • catégorie communauté :
    • La bibliothèque libre Scikit-learn, codée en Python et largement utilisée dans le monde académique et dans des entreprises variées, qui fournit des algorithmes clé en main pour faciliter l’analyse de données et l’usage de l'apprentissage automatique – représentée par Gaël Varoquaux, chercheur Inria
    • Mention spéciale à la plateforme logicielle Vidjil d’analyse de séquences d’ADN des globules blancs développée depuis 2011 et utilisée par une quarantaine de laboratoires nationaux et internationaux pour diagnostiquer et suivre les leucémies – représentée par Mathieu Giraud du Centre de recherche en informatique, signal et automatique de Lille (CNRS/Centrale Lille/Université de Lille)
    • Mention spéciale au système WebObs, son ensemble d’outils sous licences libres et son interface web unique pour une surveillance intégrée, centralisée et automatisée en temps réel de phénomènes naturels comme les volcans et risques sismiques – représenté par François Beauducel de l’UMR-Institut de physique du globe de Paris (CNRS/IPGP)
  • catégorie documentation :
    • Le langage de programmation FAUST dédié au traitement numérique du signal audio et à la synthèse sonore, en particulier la conception de synthétiseurs, d'instruments de musique et d'effets audio – représenté par Stéphane Letz du centre national de création musicale de Lyon GRAME
    • Mention spéciale à la plateforme logicielle OpenViBE qui facilite la conception, les tests et l’utilisation d’interfaces cerveau-ordinateur, grâce à un traitement en temps réel de données cérébrales, et à sa documentation particulièrement exhaustive, selon le profil de l’utilisateur ou le matériel utilisé – représenté par Fabien Lotte, chercheur Inria
  • Prix du jury, pour un projet exemplaire rassemblant les composantes techniques, l’animation de communauté et la documentation :
    • Le logiciel d’analyse de données astrophysiques issues de télescopes Gammapy, développé depuis 2014 et devenu un outil standard de traitement des données astrophysiques, utilisé par exemple par l’observatoire européen CTA pour analyser ses données ouvertes ou  par la Nasa – représenté par Bruno Khélifi du laboratoire AstroParticule et Cosmologie (CNRS/Université de Paris)
    • Mention spéciale à la plateforme de simulation GAMA, développée depuis 2010 par un consortium de partenaires universitaires et industriels, et son environnement de développement de modélisation et simulation, permettant de créer des modèles à base d’agents et d’explorer des phénomènes émergents dans de nombreuses disciplines scientifiques – représenté par Alexis Drogoul, chercheur IRD
    • Mention spéciale à l’outil Sppas d’annotation automatique de corpus oraux et d’aide à l’analyse de ces annotations, logiciel donc dédié à la linguistique computationnelle et la linguistique de corpus, indépendant de la langue utilisée. Ce logiciel est maintenu par une CR CNRS en section 7 dans le plus pur esprit du logiciel libre. Le jury a souhaité mettre en avant ce logiciel avec un accessit dans la catégorie prix du jury – représenté par Brigitte Bigi du Laboratoire parole et langage (CNRS/ Aix-Marseille Université)