ChatGPT en la educación universitaria: ¿aliado inevitable o plagio?

La prestigiosa publicación científica Nature difundió el 24 de agosto un trabajo titulado “Percepción, rendimiento y detectabilidad de la inteligencia artificial conversacional en 32 cursos universitarios”. Se trata de un análisis que busca sentar posición y arrojar luz en un debate muy actual: ¿utilizar ChatGPT en el ámbito universitario equivale a plagiar? Este estudio comparó el rendimiento de esta herramienta con el de estudiantes de 32 cursos universitarios; evaluó si su uso puede ser detectado mediante programas creados para tal fin, y realizó una encuesta global en cinco países para comprender las percepciones de estudiantes y educadores sobre el uso de ChatGPT. 

Para investigar el desempeño de la IA y compararlo con el de los estudiantes, se le pidió a profesores de estos cursos de la NYUAD (el campus satélite de la Universidad de New York en Abu Dhabi) que proporcionen tres respuestas de estudiantes a una serie de preguntas establecidas de antemano. Luego se le pidió a ChatGPT que produjera tres conjuntos de respuestas a las diez preguntas, que luego fueron evaluadas junto con las respuestas escritas por estudiantes por tres calificadores que desconocían cuáles respuestas pertenecían a una máquina y cuáles a un humano. 

Las respuestas generadas por ChatGPT lograron una calificación promedio similar o superior a la de los estudiantes en 9 de los 32 cursos. Solo en los cursos de matemáticas y economía los estudiantes superaron ampliamente a ChatGPT. Mano a mano, la IA superó a los estudiantes de manera más marcada en el curso "Introducción a las Políticas Públicas", donde su calificación promedio fue de 9.56 en comparación con 4.39 de los estudiantes. Sin embargo, todos estos resultados muestran que no está tan clara ni definitiva la superioridad de la IA, como podía creerse al principio.

El estudio de Nature también indaga sobre la opinión que tienen del uso de ChatGPT 1.600 individuos de Brasil, India, Japón, Estados Unidos y el Reino Unido (incluyendo al menos 200 estudiantes y 100 profesores de cada país). El 74% de los estudiantes indicó que usaría ChatGPT en su trabajo. Para los estudiantes que dijeron que lo usarían, las dos principales razones son mejorar sus habilidades y ahorrar tiempo. En cuanto a aquellos que dijeron que no lo emplearían (26%), sus razones principales son no saber cómo hacerlo o no tener la necesidad, más que el temor a ser penalizados o actuar de manera poco ética. Estos datos contrastan con la opinión de los profesores encuestados: para el 69%, el uso de ChatGPT es una forma de plagio. Para los autores de este trabajo, el conflicto inherente entre estos dos puntos de vista antagónicos plantea un desafío importante que las instituciones educativas deberán abordar en el corto plazo, creando políticas de integridad académica adecuadas en relación a la IA generativa en general y ChatGPT específicamente.

Por último, Nature concluyó su análisis evaluando el grado de detectabilidad del uso de ChatGPT en todas las respuestas. Para ello utilizó dos herramientas, GPTZero y el propio clasificador de texto de IA de OpenAI. Las dos están diseñadas específicamente para descubrir si un texto fue generado por inteligencia artificial. Al hacer esto, Nature buscó determinar cuál era el porcentaje de respuestas erróneamente atribuidas tanto a ChatGPT como a los alumnos. De las 320 preguntas  se excluyeron 40 que correspondían a ecuaciones matemáticas. De las 280 restantes, el clasificador de texto de OpenAI clasificó erróneamente el 5% de las entregas de estudiantes como generadas por IA y el 49% de las entregas de ChatGPT como generadas por humanos. GPTZero tuvo una tasa de falsos positivos más alta (18%), pero una tasa de falsos negativos más baja (32%).

Este estudio nos permite vislumbrar la que podría ser sólo la punta del iceberg. La complejidad de la adopción de tecnologías de inteligencia artificial como ChatGPT en el ámbito educativo es un problema que debemos abordar lo más pronto posible. Para eso, resulta vital trabajar en el desarrollo de políticas y enfoques que aborden tanto las necesidades de los estudiantes como las preocupaciones de los profesores.