Inteligencia artificial conversacional engaña a humanos por primera vez en la historia
Un equipo de investigadores de la Universidad de California en San Diego ha logrado un hito sin precedentes en el campo de la inteligencia artificial (IA) al desarrollar un sistema conversacional capaz de superar la prueba de Turing, un test ideado por Alan Turing en 1950 para evaluar la capacidad de una máquina de exhibir un comportamiento inteligente equivalente o indistinguible del de un humano.
El estudio, publicado recientemente en el repositorio arXiv, detalla cómo su modelo de lenguaje, denominado GPT-4, logró engañar a más del 54% de los participantes en la prueba, haciéndoles creer que estaban interactuando con otro ser humano.
La prueba de Turing, propuesta por el matemático británico Alan Turing en su artículo de 1950, «Computing Machinery and Intelligence», establece un escenario en el que un interrogador humano interactúa simultáneamente con un humano y una máquina a través de un canal de texto, sin saber cuál es cuál. Si el interrogador no puede distinguir consistentemente entre los dos, se considera que la máquina ha pasado la prueba.
En el estudio de la Universidad de California en San Diego, se empleó una configuración similar a la prueba original, pero con la incorporación de dos modelos de lenguaje adicionales: GPT-3.5 y ELIZA; este último, es un sistema de IA conversacional desarrollado en la década de 1960. Un total de 500 participantes interactuaron durante cinco minutos con cada uno de los cuatro interlocutores (un humano real, GPT-4, GPT-3.5 y ELIZA) y luego se les pidió que determinaran si cada uno era humano o no.
Los resultados del estudio demostraron un rendimiento superior por parte de GPT-4 en comparación con los demás sistemas. Alrededor del 54% de los participantes creyeron estar conversando con un humano real al interactuar con GPT-4, mientras que esta cifra se redujo a 50% y 22% para GPT-3.5 y ELIZA, respectivamente. Cabe destacar, que el participante humano real fue identificado correctamente como tal en el 67% de los casos.
Los autores del estudio resaltan que este logro «proporciona la primera demostración empírica de que un sistema artificial supera una prueba de Turing interactiva de dos jugadores» basada en la conversación. Sin embargo, también advierten que «el razonamiento de los participantes sugiere que los factores estilísticos y socioemocionales» parece jugar un papel más importante en la superación de la prueba que las «concepciones tradicionales de inteligencia».
Por su parte, la Dra. Nell Watson, científica del Instituto de Ingenieros Eléctricos y Electrónicos (IEEE), señala que «los modelos de lenguaje basados en IA son infinitamente flexibles», ya que son capaces de «sintetizar respuestas a una amplia gama de temas» e incluso «describirse a sí mismos con personalidad y valores impulsados por el carácter». Esto, según la Dra. Watson, representa «un salto enorme en comparación con algo programado manualmente por un humano, sin importar cuán inteligente o cuidadoso sea». El éxito de GPT-4 en la prueba de Turing marca un hito importante en el desarrollo de la IA conversacional, pero también plantea interrogantes sobre la naturaleza de la inteligencia y la conciencia. Si bien la capacidad de engañar a los humanos en una conversación no es equivalente a la inteligencia humana, este avance demuestra el potencial de la IA para desarrollar comportamientos cada vez más complejos y sofisticados. Queda por ver cómo se utilizará esta tecnología en el futuro y qué impacto tendrá en la sociedad.