{"id":223,"date":"2024-10-15T15:55:15","date_gmt":"2024-10-15T18:55:15","guid":{"rendered":"https:\/\/chatvip.com.ar\/?p=223"},"modified":"2024-10-21T19:57:14","modified_gmt":"2024-10-21T22:57:14","slug":"la-estadistica-de-los-errores","status":"publish","type":"post","link":"https:\/\/chatvip.com.ar\/?p=223","title":{"rendered":"La estad\u00edstica de los errores"},"content":{"rendered":"<p>Seis investigadores de IA exploraron la fiabilidad de modelos de lenguaje complejo como\u00a0GPT de OpenAI, LLaMA de Meta y BLOOM de BigScience a trav\u00e9s de tres elementos principales: la dificultad de la concordancia, el n\u00famero de veces que los\u00a0<em>chatbots<\/em>\u00a0se negaron a responder y la estabilidad de los modelos. Esencialmente, los cient\u00edficos formularon miles de preguntas sobre ciencia, geograf\u00eda, aritm\u00e9tica y lenguaje. Luego categorizaron cada solicitud seg\u00fan su dificultad y cotejaron la informaci\u00f3n obtenida.<\/p>\n<p>Gracias a las mejoras en el entrenamiento y la calidad de las bases de datos, los LLM fueron m\u00e1s precisos que antes. Sin embargo, no se limitaron ni moderaron ante preguntas complejas de los usuarios, como ocurr\u00eda al principio. Ante una solicitud complicada,\u00a0el\u00a0<em>chatbot<\/em>\u00a0responde lo m\u00e1s probable, pero no necesariamente lo correcto. El problema se agrava al considerar que el solicitante de la informaci\u00f3n tambi\u00e9n desconoce el tema. <em>\u201cEst\u00e1n respondiendo a casi todo en estos d\u00edas, y eso significa respuestas m\u00e1s correctas, pero tambi\u00e9n m\u00e1s incorrectas\u201d<\/em>, resume Jos\u00e9 Hern\u00e1ndez-Orello, coautor del estudio\u00a0publicado en\u00a0<em>Nature<\/em>.<\/p>\n<div class=\"ExternalLinkEmbedWrapper-hNDkqw fSfQkP\" data-testid=\"external-link-embed--inline\" data-event-boundary=\"click\" data-event-click=\"{&quot;pattern&quot;:&quot;ExternalLinkEmbed&quot;}\" data-in-view=\"{&quot;pattern&quot;:&quot;ExternalLinkEmbed&quot;}\" data-include-experiments=\"true\">\n<p>El estudio tambi\u00e9n encontr\u00f3 que las personas no pueden distinguir entre una respuesta precisa y una inexacta. Un usuario convencional de\u00a0<em>chatbots<\/em>\u00a0no es capaz de supervisar la fiabilidad de los modelos que usa, recalca el autor. Adem\u00e1s, determin\u00f3 que las alucinaciones ocurr\u00edan incluso en preguntas sencillas. No es posible determinar una <em>\u201cregi\u00f3n operativa segura\u201d<\/em> en la que la informaci\u00f3n se presente sin riesgos.<\/p>\n<\/div>\n","protected":false},"excerpt":{"rendered":"<p>Seis investigadores de IA exploraron la fiabilidad de modelos de lenguaje complejo como\u00a0GPT de OpenAI, LLaMA de Meta y BLOOM de BigScience a trav\u00e9s de tres elementos principales: la dificultad de la concordancia, el n\u00famero de veces que los\u00a0chatbots\u00a0se negaron a responder y la estabilidad de los modelos. Esencialmente, los cient\u00edficos formularon miles de preguntas [&hellip;]<\/p>\n","protected":false},"author":1,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[1],"tags":[],"class_list":["post-223","post","type-post","status-publish","format-standard","hentry","category-general"],"featured_image_src":{"landsacpe":false,"list":false,"medium":false,"full":false},"_links":{"self":[{"href":"https:\/\/chatvip.com.ar\/index.php?rest_route=\/wp\/v2\/posts\/223"}],"collection":[{"href":"https:\/\/chatvip.com.ar\/index.php?rest_route=\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/chatvip.com.ar\/index.php?rest_route=\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/chatvip.com.ar\/index.php?rest_route=\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/chatvip.com.ar\/index.php?rest_route=%2Fwp%2Fv2%2Fcomments&post=223"}],"version-history":[{"count":1,"href":"https:\/\/chatvip.com.ar\/index.php?rest_route=\/wp\/v2\/posts\/223\/revisions"}],"predecessor-version":[{"id":224,"href":"https:\/\/chatvip.com.ar\/index.php?rest_route=\/wp\/v2\/posts\/223\/revisions\/224"}],"wp:attachment":[{"href":"https:\/\/chatvip.com.ar\/index.php?rest_route=%2Fwp%2Fv2%2Fmedia&parent=223"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/chatvip.com.ar\/index.php?rest_route=%2Fwp%2Fv2%2Fcategories&post=223"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/chatvip.com.ar\/index.php?rest_route=%2Fwp%2Fv2%2Ftags&post=223"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}