banner

Nouvelles

Feb 18, 2024

Un système d'automatisation ouvert pour la détection des journaux prédateurs

Rapports scientifiques volume 13, Numéro d'article : 2976 (2023) Citer cet article

11 000 accès

3 citations

57 Altmétrique

Détails des métriques

Une correction de l'auteur à cet article a été publiée le 8 mai 2023.

Cet article a été mis à jour

Le nombre croissant de revues en ligne en libre accès favorise les échanges universitaires, mais la prévalence de revues prédatrices mine le processus de reporting scientifique. La collecte de données, l'extraction de fonctionnalités et la prédiction de modèles sont des étapes courantes dans les outils conçus pour faire la distinction entre les revues universitaires et les sites Web d'éditeurs légitimes et prédateurs. Les auteurs les incluent dans leur système de vérification prédatrice (AJPC) proposé dans des revues universitaires, basé sur des méthodes d’apprentissage automatique. Le processus de collecte de données de l'AJPC extrait 833 listes noires et 1 213 listes blanches d'informations de sites Web à utiliser pour identifier des mots et des expressions susceptibles d'indiquer la présence de revues prédatrices. L'extraction de fonctionnalités est utilisée pour identifier les mots et les termes qui aident à détecter les sites Web prédateurs, et l'étape de prédiction du système utilise huit algorithmes de classification pour distinguer les revues potentiellement prédatrices des revues légitimes. Nous avons constaté que l'amélioration de l'efficacité de la classification du modèle du sac de mots et de l'algorithme TF-IDF avec des scores diff (une mesure des différences dans les fréquences de mots spécifiques entre les revues) peut aider à identifier les mots caractéristiques des revues prédatrices. Les résultats des tests de performance suggèrent que notre système fonctionne aussi bien, voire mieux, que ceux actuellement utilisés pour identifier les éditeurs et publications suspects. Le système ouvert fournit uniquement des résultats de référence plutôt que des opinions absolues et accepte les demandes et commentaires des utilisateurs pour mettre à jour le système et optimiser les performances.

Les revues prédatrices sont considérées comme une menace importante pour la fiabilité et la légitimité de la recherche et des rapports scientifiques traditionnels1,2. Définies comme des publications trompeuses ou en écriture seule3,4, les revues prédatrices et les actes de conférences prédatrices répondent à la demande croissante des universitaires de voir leurs recherches publiées5,6,7,8. Ils se présentent comme ayant des processus rapides d’évaluation des manuscrits, mais oublient souvent de mentionner qu’ils n’adhèrent pas aux procédures standard d’évaluation par les pairs. Certaines revues prédatrices sont connues pour utiliser de fausses informations pour inciter les chercheurs à soumettre des manuscrits, puis exiger des frais de traitement d'articles (APC) exorbitants avant la publication1,9,10. En 2021, la base de données Predatory Reports de Cabells montre qu'il existait environ 15 000 revues prédatrices actives, dont les auteurs payaient collectivement des centaines de milliers de dollars pour que leurs articles soient publiés11.

Lorsque des résultats de recherche inexacts ou mal exécutés sont publiés dans des revues prédatrices, ils peuvent affecter les études ultérieures et la véracité des informations diffusées au grand public1. Dans certains cas, ces résultats de recherche, ainsi que d’autres résultats de recherche spécieux, sont publiés sur des sites Web ou dans des médias tels que Facebook, Twitter et Line, ou rapportés par des chaînes de télévision et de radio locales12. Dans de nombreux cas, les personnes qui lisent ou entendent ces histoires ne reçoivent pas suffisamment d’informations pour vérifier les sources originales, créant finalement une situation dans laquelle les consommateurs d’informations ne peuvent pas faire la distinction entre trois types de science : légitime, indésirable et pseudo13. Un exemple simple vient de Taïwan, où une équipe de recherche a affirmé avoir trouvé des données indiquant que la consommation quotidienne d’ananas était une alternative suffisante aux traitements médicaux contre les taches oculaires appelées corps flottants du corps vitré14. Lorsque l'article original a été publié en 2019, toutes les principales chaînes d'information de Taiwan ont rapporté ses conclusions, qui ont été republiées sur plusieurs sites de médias sociaux. Cependant, les chercheurs qui ont examiné l'étude en détail ont trouvé plusieurs points à contester, tels que l'absence totale de données démographiques sur les participants, l'absence de groupe témoin, des méthodes statistiques incorrectes et une combinaison d'exagérations et d'erreurs de grammaire de base tout au long du rapport écrit. Dans un deuxième exemple tiré du Macédonian Journal of Medical Science, un groupe de chercheurs a affirmé qu’« il pourrait y avoir une structure semblable à un trou noir au centre de la Terre ». Le même auteur de ce rapport a écrit un article affirmant que les coronavirus sont causés par le rayonnement du réseau 5G15. Les experts qui ont réexaminé ces études ont émis l’hypothèse que les auteurs avaient délibérément soumis des manuscrits ridicules à une revue prédatrice ou qu’un programme d’intelligence artificielle avait été utilisé pour insérer des termes et des expressions critiques dans un article afin de le faire passer pour une recherche légitime.

PARTAGER