Minuto a Minuto

Internacional EE.UU. investiga a México, China, la UE y otros países por posible afectación a su industria
Según el gobierno de EE.UU., en varios sectores industriales muchos países producen más de lo que pueden absorber sus propios mercados
Internacional Trump dice que EE.UU. investiga un supuesto complot iraní con drones contra California
Trump dijo que autoridades federales revisan un memorando del FBI que advierte sobre un posible ataque con drones iraníes contra EE.UU.
Ciencia y Tecnología La sonda Van Allen de la NASA reingresa a la Tierra por el Pacífico sin causar daños
La sonda Van Allen reingresó sobre la región del océano Pacífico oriental, aproximadamente ocho años antes de lo previsto
Entretenimiento Kanye West deberá pagar 140 mil dólares a exempleado por trabajos en su mansión
Tony Saxon que acusó a Kanye West de incumplir un contrato y despedirlo injustamente tras sufrir una lesión mientras trabajaba en la mansión
Economía y Finanzas El Grupo de Acción Financiera arranca evaluación antilavado a México
La SHCP informó que el GAFI inició el proceso en materia de prevención, combate al lavado de dinero y financiamiento de actividades ilícitas
Alumno del IPN es premiado por software antiplagio
Internet

El primer lugar en la categoría de Alineación de Textos de la 11 edición del Evaluation Lab on Uncovering Plagiarism, Authorship, and Social Software Misuse (conocido como PAN) celebrado en la Universidad de Sheffield, Inglaterra, fue otorgado al alumno de doctorado, Miguel Ángel Sánchez Pérez y los investigadores Alexander Gelbukh y Grigori Sidorov, del Centro de Investigación en Computación (CIC) del Instituto Politécnico Nacional (IPN).

El software que desarrollaron es un modelo de detección de plagio que permite identificar textos producto de la piratería.

El modelo, desarrollado por Sánchez con la asesoría de Gelbukh y Sidorov para obtener el grado de maestro en Ciencias de la Computación, superó en el certamen a trabajos desarrollados por competidores de otros países como Chile, Estados Unidos, España, Alemania, China y Reino Unido.

Sánchez señaló que descubrir un plagio implica la búsqueda y conocimiento de una amplia cantidad de textos en fuentes originales, por ello científicos de todo el mundo centran sus investigaciones en la generación de modelos para la detección automática de plagio.

Explicó que la localización de fragmentos de texto que son semejantes entre dos documentos se le denomina alineación.

Para competir, el modelo debía llevarse a un sistema o software con alto grado de eficiencia, porque se evalúan miles de documentos, se hace un gran número de comparaciones entre textos en busca de fragmentos plagiados.

“En el certamen se proporciona a los equipos competidores una base de datos aproximado de 5 mil pares de documentos a comparar, los cuales pueden o no contener plagio”, señaló.

Sánchez también comentó que el proceso del concurso consiste en encontrar con el modelo desarrollado los fragmentos similares entre un par de documentos que les fueron proporcionados.

“Para evaluar qué tan bien encontramos un par de fragmentos similares, las medidas usadas son precisión y exhaustividad. Precisión se refiere a cuántos caracteres del texto que detecté realmente fueron plagiados, mientras que exhaustividad se refiere a cuántos, de la cantidad de caracteres que fueron plagiados, detecté. La combinación de esos dos parámetros nos permitió ganar el concurso”, expresó el galardonado.

El politécnico señaló que es difícil que un sistema de este tipo tenga una certeza de 100 por ciento.

“Hace falta la intervención de un humano, pero el sistema puede ayudarle a encontrar textos que quizá no había considerado y con fragmentos específicos para hacerlo más rápido”, subrayó.

Sánchez dijo que además de la detección de plagio, el modelo puede ayudar a la construcción de sitios de contenido colectivo, como Wikipedia, donde muchas personas escriben artículos, pero se elaboran numerosos contenidos sobre el mismo tema; el modelo podría informar al que escribe si su texto es único o posee similitudes que le permitirían integrarse a otro.

Señaló que a diferencia de otros participantes que no dan a conocer la forma en que obtienen sus resultados, “nosotros tenemos el código abierto en una página del doctor Alexander Gelbukh, por lo que cualquier persona puede acceder y usarlo, solo tiene que citar el artículo”.

Por la aportación tecnológica, con ese mismo modelo, el estudiante politécnico recientemente obtuvo el segundo lugar nacional en el Concurso de Mejor Tesis en Inteligencia Artificial, organizado por la Sociedad Mexicana de Inteligencia Artificial (SMIA).

Alumno del IPN es premiado por software antiplagio - Miguel-Angel-Sanchez-Perez-IPN_MILIMA20150105_0009_8
Miguel Ángel Sánchez Pérez (foto: Milenio)

Con información de Milenio