La detección de imágenes manipuladas en artículos científicos se convirtió en una de las principales vías para destapar resultados fraudulentos. Gracias al análisis exhaustivo de las figuras publicadas en los papers y el hallazgo de duplicaciones, rotaciones o burdos cortapegas, investigadores como Elisabeth Bik y sitios como la web PubPeer destaparon auténticas factorías de estudios falseados y provocaron la caída de personajes tan relevantes como el rector de la Universidad de Stanford, Marc Tessier-Lavigne por ejercer estas malas prácticas.
Por este motivo, y para evitar que se publiquen artículos que después tengan que ser retractados, la revista Science anunció en un editorial este jueves que en 2024 sus seis principales publicaciones adoptarán el uso de Proofig, una herramienta de análisis de imágenes impulsada por inteligencia artificial (IA) que permite detectar imágenes alteradas con mayor acierto que los revisores humanos.
“Science estuvo testeando Proofig durante varios meses con pruebas claras de que se pueden detectar figuras problemáticas antes de su publicación, por lo que su uso se ampliará a todos los artículos bajo consideración que presenten imágenes relevantes”, escribe el editor jefe de la revista, Holden Thorp. “Esto debería ayudar a identificar tanto los simples errores como la actividad fraudulenta antes de tomar una decisión”.
Un proceso de verificación
En el editorial, Thorp describe cómo se incorporará Proofig al proceso de revisión de Science y cómo se notificará a los autores en caso de que surjan problemas. La herramienta analizará las imágenes y generará un informe que señalará duplicaciones y otras anomalías, como rotación, distorsión de escala y empalme. El editor del artículo revisará entonces los hallazgos de la IA y determinará si se trata de rotaciones o duplicaciones intencionales que se explican en el artículo o decide suprimirlas, porque es importante recalcar que no toda la manipulación de imágenes se realiza con intenciones de engaño (a veces se produce por accidente, por razones estéticas o para hacer más comprensible una figura).
No toda la manipulación de imágenes se realiza con intenciones de engaño; a veces se produce por accidente, por razones estéticas o para hacer más comprensible una figura
Durante el tiempo en que se probó la herramienta, los autores generalmente dieron una respuesta satisfactoria y solucionaron los problemas, pero en algunos casos se detectaron artículos que no deberían haberse publicado. “En el futuro, si la respuesta de los autores no es satisfactoria o plantea inquietudes adicionales, investigaremos más a fondo y tomaremos medidas que podrían incluir el rechazo del artículo”, explica Thorp. “Si surgen inquietudes sobre la integridad de la imagen de un artículo que una revista científica ya publicó, usaremos Proofig para examinar cuidadosamente las imágenes sospechosas, lo que informará acciones posteriores (por ejemplo, corrección o retractación)”.
Proofig no es la única herramienta de IA que se está utilizando en el mundo académico. Una empresa radicada en Viena, Imagetwin, da servicio a más de 200 universidades, sociedades científicas y editoriales, y algunos grandes grupos, como el que alberga a la revista Nature, están desarrollando aplicaciones similares. El sistema por el que funciona Imagetwin es parecido: en un primer rastreo la IA crea una “huella digital” para cada imagen del artículo y luego escanea todo el material en busca de repeticiones en el propio documento y en una gran base de datos de imágenes de otras publicaciones.
¿Lo mejor? Que lo hace en menos de diez segundos. En un experimento publicado hace unos meses, por ejemplo, el investigador Sholto David usó la herramienta para escanear más de 700 artículos científicos publicados entre 2014 y 2023 en la revista Toxicology Reports y halló duplicaciones en un 16% de ellos, un porcentaje muy superior al 4% que obtienen los rastreadores humanos. Y lo hizo en una fracción de tiempo muchísimo menor.
Una “maravillosa noticia”, según Bik
La famosa rastreadora de imágenes Elisabeth Bik asegura que es una “maravillosa noticia” que cada vez más revistas reconozcan que una fracción de los manuscritos enviados para su consideración podrían contener problemas de imagen y que estén comenzando a utilizar herramientas para detectarlos. “Así que aplaudo a las revistas del grupo Science por agregar esta herramienta a su proceso de selección editorial, similar al uso de herramientas ya implementadas para detectar similitudes textuales”, dice Bik.
Aplaudo a la revista 'Science' por agregar esta herramienta a su proceso de selección editorial, similar al uso de herramientas ya implementadas para detectar similitudes textuales
En su opinión, también es bueno saber que un editor seguirá revisando cualquier posible hallazgo señalado por el software en busca de falsos negativos. “Pero una herramienta como Proofig no podrá encontrar todos los problemas de imágenes, por lo que aún es posible que ciertas imágenes retocadas con Photoshop pasen desapercibidas”, apunta. “Tampoco podrá detectar imágenes falsas generadas por IA, lo que es un motivo de preocupación cada vez mayor”.
La importancia de actuar antes
Isidro F. Aguillo, jefe del Laboratorio de Cibermetría del CSIC, cree que el anuncio de Science es muy relevante por el impacto que tiene generalizar la lucha antiplagio más allá del trabajo de expertos en análisis de imágenes como Bik y alguna que otra plataforma colectiva. “Además, es destacable el hecho de que las manipulaciones se puedan detectar antes de la publicación y no tras la misma”, asegura. “Un problema importante hasta ahora era la reticencia de muchos editores a retirar el paper a pesar de las pruebas abrumadoras mostradas. De hecho cuando se lograba alguna acción, a menudo se aceptaba que los propios autores corrigieran las imágenes sin mayor reproche”.
No estaría de más recordar que la IA puede aplicarse tanto para detectar estas alteraciones como para fabricarlas y no ser detectadas fácilmente
El investigador y genetista del CNB-CSIC, Lluis Motoliu, también aplaude la iniciativa de Science de aplicar IA sistemáticamente a los manuscritos que revisan y publican. “Muchas de estas aplicaciones pueden revisar las figuras de los artículos con una precisión que supera a la del ojo del mejor revisor avezado”, subraya. “Era cuestión de tiempo que se aplicarán con sistematicidad”. La manipulación de imágenes, recuerda, representa la mayor parte de las vulneraciones de integridad científica en publicaciones científicas, como quedó constatado con el informe que realizó Retraction Watch en 2018 con más de 18.000 artículos retractados.
“Aunque no estaría de más recordar que la IA puede aplicarse tanto para detectar estas alteraciones como para fabricarlas y no ser detectadas fácilmente”, apunta Montoliu. En cualquier caso, recuerda, estos sistemas deberán completarse con otros que revisen texto y contexto, para detectar otras manipulaciones que alteran el registro científico. “Y que no suceda —concluye— como con los famosos artículos de Woo-Suk Hwang de 2004 y 2005, publicados en Science, que tuvieron que ser retractados en 2006 porque los datos no es ya que estuvieran manipulados, sino que estaban directamente inventados”.