Ir al contenido principal

Comprende los modelos de lenguaje grande

Es útil entender cómo funcionan los LLM y ser conscientes de sus limitaciones. Un modelo de lenguaje grande, o LLM, es un modelo de IA entrenado con grandes cantidades de texto para identificar patrones entre palabras, conceptos y frases, de modo que pueda generar respuestas a las instrucciones.

¿Cómo los LLM aprenden a generar respuestas útiles a las instrucciones? Un LLM se entrena con millones de fuentes de texto, incluidos libros, artículos, sitios web y mucho más. Este entrenamiento ayuda al modelo a aprender los patrones y las relaciones que existen en el lenguaje humano. En general, cuantos más datos de alta calidad reciba el modelo, mejor será su rendimiento. Dado que los LLM pueden identificar muchos patrones en el lenguaje, también pueden predecir qué palabra es más probable que venga a continuación en una secuencia de palabras. 

Veamos un ejemplo sencillo para obtener una comprensión básica de cómo los LLM predicen la siguiente palabra de una secuencia. Toma la frase incompleta, “Después de llover, la calle estaba...”. Un LLM puede predecir qué palabra viene a continuación calculando las probabilidades para diferentes palabras posibles. Según los datos disponibles, la palabra mojado podría tener una alta probabilidad de ser la siguiente palabra. La palabra limpia sería una probabilidad menor. Y la palabra seca, una probabilidad extremadamente baja. En este caso, el LLM podría completar la frase insertando la palabra con mayor probabilidad de venir a continuación en la secuencia, mojado. O podría ser otra palabra altamente probable como humedad. 

Un LLM puede variar en su respuesta a la misma instrucción cada vez que lo utilizas. Los LLM utilizan la estadística para analizar las relaciones entre todas las palabras de una secuencia dada y calcular las probabilidades de miles de posibles palabras siguientes en esa secuencia. Este poder predictivo permite a los LLM responder a las preguntas y peticiones, tanto si la instrucción es completar una frase sencilla o desarrollar una historia convincente para el lanzamiento de un nuevo producto o una campaña publicitaria. 

Aunque los LLM son potentes, puede que no siempre obtengas el resultado deseado. A veces se debe a limitaciones en los datos de entrenamiento de un LLM. Por ejemplo, el resultado de un LLM puede estar sesgado porque los datos de entrenamiento contienen sesgos. Estos datos pueden incluir artículos de prensa y sitios web que reflejen los prejuicios injustos presentes en la sociedad. Por ejemplo, debido a los datos con los que se ha entrenado, un LLM puede ser más probable que produzca resultados asociados una ocupación profesional con un papel específico de género. Los datos de entrenamiento de un LLM también pueden limitarse de otras formas. Por ejemplo, un LLM podría no generar contenido suficiente sobre un ámbito o tema específico porque los datos con los que se entrenó no contienen suficiente información sobre ese tema. Otro factor que puede afectar al resultado es la tendencia de los LLM a alucinar. Las alucinaciones son resultados que arroja la IA y que no son ciertos. Aunque los LLM son buenos respondiendo a muchos tipos de preguntas e instrucciones, pueden a veces generar texto que es objetivamente inexacto. Digamos que estás investigando una empresa y utilizas un LLM para ayudarte a resumir la historia de la empresa. El LLM podría alucinar y proporcionar información incorrecta sobre determinados detalles como la fecha de fundación de la empresa o el número actual de empleados. Varios factores pueden contribuir a las alucinaciones, como la calidad de los datos de entrenamiento de un LLM, la formulación de la instrucción o el método que utiliza un LLM para analizar textos y predecir la siguiente palabra de una secuencia. 

Debido a las limitaciones de un LLM, es importante que evalúes de forma crítica todos los resultados del LLM para determinar si es objetivamente preciso, es imparcial, pertinente para tu solicitud concreta y proporciona información suficiente. Tanto si utilizas la IA para resumir un informe extenso, generar ideas para comercializar un producto o esbozar un plan de proyecto, asegúrate de comprobar cuidadosamente la calidad del resultado. 

Por último, es importante no hacer suposiciones sobre las capacidades de un LLM. Por ejemplo, solo porque producía resultados de alta calidad para una carta persuasiva a un cliente, no des por sentado que obtendrás la misma calidad del resultado si utilizas la misma instrucción de nuevo en el futuro. Los modelos de lenguaje grandes son herramientas poderosas que requieren orientación humana para un uso eficaz. Ser consciente de las limitaciones de una LLM puede ayudarte a conseguir los mejores resultados posibles.

Fuente:
Coursera – Fundamentos de IA de Google.

Comentarios

Entradas más populares de este blog

Enciclopedia de Máscaras (en PDF)

No cabe duda que el Internet ha ayudado a rescatar y compartir muchas cuestiones que en tiempos anteriores era difícil pensarlo y hacerlo, dada que la logística previa a este invento no era tan rápida y “eficiente” como actualmente trata de serlo, y por esas razones, y dado el panorama del momento (donde ya muchas plataformas te cobran por tener cierta cantidad de almacenamiento o se te ponen intensas con los derechos de autor , con sus pros y contras que eso conlleva) he decidido utilizar la plataforma de Telegram para compartir estos archivos de la Enciclopedia de Máscaras , un trabajo de Mina Editores donde se documenta cientos de máscaras utilizadas en diferentes rings de México , mencionando algunas de sus características, parte de su historia y algunos detalles que hacen la delicia de todos los interesados a la lucha libre .

Análisis de rutas, abandonos y visitantes

Lo primero que tenemos que saber es por qué los usuarios me abandonan, esto nos ayuda a detectar áreas problemáticas y poder investigar qué mejoras podemos realizar para mejorar. Para ello vamos a usar dos tácticas: Por una parte el análisis de abandono en las rutas de Google Analytics combinando con el análisis de usuario de Analytics, y por las grabaciones y los mapas de color de Hotjar.

La novela gráfica estadounidense

El cómic estadounidense es la mejor muestra de la confluencia de generaciones. Ahí tenemos al maestro del underground, Robert Crumb, a quien tras años de carrera a sus espaldas no se le ocurre otra cosa que adaptar el Génesis bíblico en una extraordinaria novela gráfica que publicó en 2009, en un solo volumen y sin serialización previa, pues los días de las revistas parecen haber terminado, salvo contadas excepciones. Eddie Campbell, afincado en Australia, prosigue con su obra autobiográfica monumental, que alterna con proyectos más breves. Los hermanos Hernandez, Daniel Clowes, Charles Burns, Seth o Chester Brown siguen siendo los nombres más respetados del cómic adulto estadounidense, han publicado en los últimos años algunas de sus mejores obras. También es el caso de Chris Ware, buscador incansable de nuevos caminos, convertido en el faro de su generación. Su ansia experimentadora se explica mejor que de cualquier otra forma diciendo que su última creación es Building Stories (Fabr...