Test Turing es superado por GPT-4: ¿Qué significa esto?
El modelo de lenguaje GPT-4 ha superado el test Turing, una prueba de evaluación que puede imitar el comportamiento humano que no puede distinguirse. Este logro no solo refleja la expansión de los modelos modernos de inteligencia artificial, sino que también pregunta si GPT-4 representa una verdadera inteligencia o simplemente imitando el complejo. Hoy hablaremos sobre este tema, así que si quieres saber más, ¡sigue leyendo!
¿Qué es el Test Turing?
El Test Turing fue creado y desarrollado por Math, Computer and Logic por Alan Turing en 1950. Trabajando en uno de los legendarios tubos de vacío llamados Manchester Mark en la Universidad de Manchester, no tenía prisa con su inteligencia artificial y sus criterios.
En su artículo «Tecnología e inteligencia de la computadora», publicado en la revista «Mind», Torring ha desarrollado las características principales de una reunión de prueba, ahora llamada la prueba de la prueba. Debido a la red artificial de células nerviosas, no relacionado con el debate sobre la inteligencia artificial, se ha realizado un análisis de observación de la comunicación con esta máquina.
El objetivo es hablar sobre inteligencia o maquinaria artificial si el comportamiento de comunicación de las máquinas no puede distinguirse del comportamiento de todos. Las pruebas se basan en la suposición de que la capacidad de simular la inteligencia humana puede evaluarse para la capacidad de crear una respuesta indistinguible de las personas.
Durante el proceso de prueba, tuvieron lugar en tiempo real entre el investigador y los participantes, generalmente a través de la interfaz de conversación para evitar la apariencia o la voz que afecta el juicio de la investigación.
Algunas personas no saben cómo distinguir GPT-4 de personas reales
Los resultados del estudio hicieron científicos de helados. Después de analizar los datos, un grupo de investigadores descubrió que más de la mitad de los participantes no sabían cómo distinguir a quién a los humanos.
- 54 % cree que GPT-4 es una persona real
- 50 % cree que GPT-3.5 es inteligencia artificial
- 22 % piensa que Eliza tiene características humanas
Los científicos confirman que los sistemas pueden sufrirlos serán consecuencias económicas y sociales generales. Ellos dijeron que pueden realizar las funciones dedicadas a los empleados humanos para engañar al público o sus propios operadores, destruir creencias sociales en interacciones reales.
¿Qué tiene de malo el Test Turing?
Durante el Test Turing, la evaluación de diferentes juegos incluye comunicación basada en texto con personas reales y programas de inteligencia artificial (máquina o chat). Esta es una prueba ciega, por lo que los tasadores no saben si envían SMS a una persona o chatear.
Si los programas IA han creado con éxito la misma respuesta para esa persona (dentro del alcance donde los alumnos tienen dificultades para distinguirlo con el programa y la IA de una persona), se cree que la IA ha superado. Sin embargo, debido a que la prueba de prueba se basa en una explicación subjetiva, estos resultados también lo están.
Los científicos creen que hay algunas limitaciones para las pruebas de Turing. Por ejemplo, cada juego en el proceso de prueba está diseñado para demostrar si el dispositivo puede imitar a alguien o no. Los expertos toman decisiones basadas en el lenguaje o la melodía de los mensajes recibidos.
El Chat GPT es perfecto para simular el lenguaje humano, incluso para cumplir, en el que proporciona información inexacta. Por lo tanto, la prueba claramente no evalúa la teoría y la capacidad lógica de la máquina. Los resultados de El test Turing no pueden indicar si el dispositivo puede ser interno o no.
A menudo pensamos en nuestras actividades pasadas y pensamos en nuestras vidas y nuestras soluciones sobre las capacidades importantes, lo que nos impide repetir errores similares. Lo mismo se aplica a la inteligencia artificial, según la investigación de la Universidad de Stanford, esto muestra que las máquinas pueden ser más independientes de usar para todos.
¿Cuándo el Test Turing fue derrotado?
Uno de los momentos más destacados en la historia del test Turing tuvo lugar en 2014, cuando el programa de conversación de Eugene Gustman fue desarrollado por los científicos Vladimir Veselov y Yujin Demchenko, tratando de luchar.
Eugene, diseñado para modelar un niño ucraniano de 13 años, engañó al 33% de los jueces en la Asociación Real de Londres, obligándolos a convencerlos de que era humano. Este evento se marcó por primera vez, cuando el programa fue ampliamente reconocido que derrotó El test Turing, aunque esta declaración podría ser discutida y verificada.
Las consecuencias de pasar El test Turing
Superar el test Turing Yujin Gustman ha causado en el debate profundo sobre el futuro de la inteligencia artificial y sus consecuencias. Por un lado, este es un progreso significativo en el desarrollo de programas que pueden modelar los pensamientos y la comunicación humana. Por otro lado, esto plantea problemas éticos y problemas de seguridad, especialmente en el campo de los ciberdelincuentes, donde la capacidad de imitar a las personas puede usarse para fraude.
A pesar de su influencia, la prueba no escapa a las críticas. Algunas personas dicen que la prueba es demasiado grande sobre la posibilidad de fraude automovilístico, no de capacidad o reconocimiento teórico. Otros señalan que la definición de inteligencia de Turing es demasiado limitada porque no incluye aspectos como la creatividad, la compasión o la comprensión emocional.
La importancia de El test Turing en la actualidad
En la era actual, en la que la inteligencia artificial (IA) está cada vez más integrada con nuestra vida diaria, El test Turing tiene una actualización significativa. Esta prueba no solo es compatible como un hito histórico en el campo de la informática e inteligencia artificial, sino que también constituye un recordatorio continuo de los objetivos y limitaciones de estas tecnologías.
Su importancia en el contexto contemporáneo se puede dividir en algunos aspectos principales. Las pruebas siguen siendo una herramienta básica para evaluar la complejidad de los sistemas de inteligencia artificial. Aunque el criterio del «fraude» de la prueba es la causa del debate, la capacidad de la máquina para convencer a la interacción humana sigue siendo un indicador impresionante de su progreso. Esto es especialmente cierto en áreas como el desarrollo de conversaciones, asistentes virtuales y otras interfaces de interfaz.
Limitaciones estrictas en la investigación de inteligencia artificial
El test Turing no podría estar mal. Su principal crítica está relacionada con la forma en que se usa en la tradición, generalmente en una forma de interrogatorio muy limitada, por lo que una computadora con una tecnología en ese momento puede demostrar la misma inteligencia.
En muchos casos, al aplicar la prueba, las preguntas formuladas sobre la computadora se han cerrado relacionados con el tipo de respuesta «sí» o «no». A veces, estas preguntas son tan simples para los programas de computadora que no es notable como un testimonio de su inteligencia artificial.
Por otro lado, cuando se usa el test Turing con problemas de abierto o chat, la reacción de los programas de computadora puede volverse muy caótica. Aunque los programas de computadora de hoy son más inteligentes, podemos decir que, según eso, la pregunta abierta les hace responder que está claro para su diálogo en el cuerpo y la sangre, descubrió que estaba hablando con el automóvil.
En el caso de muchos investigadores, la pregunta es si la computadora puede pasar El test Turing o no. En lugar de centrarse en cómo puede convencer a alguien de que es una persona, no en programas de computadora, es importante ver cómo interactuar y efectivamente. Por ejemplo, usando la interfaz de conversación.