Chat Vip

La estadística de los errores

Webmaster2024-10-21T19:57:14-03:00

Seis investigadores de IA exploraron la fiabilidad de modelos de lenguaje complejo como GPT de OpenAI, LLaMA de Meta y BLOOM de BigScience a través de tres elementos principales: la dificultad de la concordancia, el número de veces que los chatbots se negaron a responder y la estabilidad de los modelos. Esencialmente, los científicos formularon miles de preguntas sobre ciencia, geografía, aritmética y lenguaje. Luego categorizaron cada solicitud según su dificultad y cotejaron la información obtenida.

Gracias a las mejoras en el entrenamiento y la calidad de las bases de datos, los LLM fueron más precisos que antes. Sin embargo, no se limitaron ni moderaron ante preguntas complejas de los usuarios, como ocurría al principio. Ante una solicitud complicada, el chatbot responde lo más probable, pero no necesariamente lo correcto. El problema se agrava al considerar que el solicitante de la información también desconoce el tema. “Están respondiendo a casi todo en estos días, y eso significa respuestas más correctas, pero también más incorrectas”, resume José Hernández-Orello, coautor del estudio publicado en Nature.

El estudio también encontró que las personas no pueden distinguir entre una respuesta precisa y una inexacta. Un usuario convencional de chatbots no es capaz de supervisar la fiabilidad de los modelos que usa, recalca el autor. Además, determinó que las alucinaciones ocurrían incluso en preguntas sencillas. No es posible determinar una “región operativa segura” en la que la información se presente sin riesgos.

275

Share this post

Facebook Twitter LinkedIn Google + Email

Related Posts

Usabilidad y agilidad en herramientas de Machine Learning

Con la integración de un agente de IA potenciado por un servidor MCP a las herramientas de análisis predictivo, convertimos... read more

Un collar de perro con Inteligencia Artificial

Fi, la empresa enfocada en desarrollar collares inteligentes para perros, lanzó su último producto, Fi Series 3+, potenciado con inteligencia... read more

La Ciudad de Buenos Aires reunió a expertos en Inteligencia Artificial para repensar el futuro del trabajo

Con el objetivo de analizar los impactos de la inteligencia artificial (IA) en el futuro del empleo y la formación,... read more

Los desafíos que plantean las nuevas tecnologías en el ámbito laboral

Existen tecnologías que analizan expresiones faciales en entrevistas de trabajo para predecir comportamientos como, por ejemplo, qué probabilidad hay de... read more

Topacio Labs

Topaz Labs, un software de mejora de fotografías y videos, es una de las herramientas de inteligencia artificial clave que... read more

Los nuevos rivales en la carrera hacia la mejor Inteligencia Artificial

Copilot, el chatbot de la compañía cofundada por Bill Gates, incluye tecnología similar a ChatGPT Microsoft ha identificado a OpenAI, startup... read more

Chat Vip