Chat Vip

La estadística de los errores

Webmaster2024-10-21T19:57:14-03:00

Seis investigadores de IA exploraron la fiabilidad de modelos de lenguaje complejo como GPT de OpenAI, LLaMA de Meta y BLOOM de BigScience a través de tres elementos principales: la dificultad de la concordancia, el número de veces que los chatbots se negaron a responder y la estabilidad de los modelos. Esencialmente, los científicos formularon miles de preguntas sobre ciencia, geografía, aritmética y lenguaje. Luego categorizaron cada solicitud según su dificultad y cotejaron la información obtenida.

Gracias a las mejoras en el entrenamiento y la calidad de las bases de datos, los LLM fueron más precisos que antes. Sin embargo, no se limitaron ni moderaron ante preguntas complejas de los usuarios, como ocurría al principio. Ante una solicitud complicada, el chatbot responde lo más probable, pero no necesariamente lo correcto. El problema se agrava al considerar que el solicitante de la información también desconoce el tema. “Están respondiendo a casi todo en estos días, y eso significa respuestas más correctas, pero también más incorrectas”, resume José Hernández-Orello, coautor del estudio publicado en Nature.

El estudio también encontró que las personas no pueden distinguir entre una respuesta precisa y una inexacta. Un usuario convencional de chatbots no es capaz de supervisar la fiabilidad de los modelos que usa, recalca el autor. Además, determinó que las alucinaciones ocurrían incluso en preguntas sencillas. No es posible determinar una “región operativa segura” en la que la información se presente sin riesgos.

250

Share this post

Facebook Twitter LinkedIn Google + Email

Related Posts

Un nuevo paradigma educativo

La educación y la formación resultan claves para el mercado laboral: tanto para complementar los estudios como para mantenerse actualizado.... read more

Los riesgos de DeepSeek

La inteligencia artificial (IA) de DeepSeek lidera las listas de descargas en App Store y Google Play Store, una posición... read more

Los nuevos rivales en la carrera hacia la mejor Inteligencia Artificial

Copilot, el chatbot de la compañía cofundada por Bill Gates, incluye tecnología similar a ChatGPT Microsoft ha identificado a OpenAI, startup... read more

Google y Latam le ponen alas con inteligencia artificial

Según Ramiro Sanchez, CMO de Google Latinoamérica, “la inteligencia artificial nos está ayudando a obtener excelentes resultados de negocio, pero... read more

Inteligencia Artificial especializada versus Inteligencia Artificial general

Hay dos categorías principales de inteligencia artificial. La inteligencia artificial de tipo «narrow» (estrecha), también conocida como «weak» (débil), solo... read more

Central de biomasa

Una central de biomasa es una planta de energía que se alimenta de biomasa para producir electricidad. Derivado de la definición... read more

Chat Vip