Home AI News ES ¡Incremente la ventana de contexto de LLMs con el nuevo método de Anthropics!

¡Incremente la ventana de contexto de LLMs con el nuevo método de Anthropics!

Updated on May 16,2024

¡Incremente la ventana de contexto de LLMs con el nuevo método de Anthropics!

Índice 📑

🌟 Introducción

🧠 Comprender el Modelo Claud 2.1

📝 Capacidades y Características

💡 Mejoras de Claud 2.1 sobre Versiones Anteriores

🔍 Método de Promoción: Maximizando la Capacidad de Recuerdo

🔄 Funcionamiento del Método de Promoción

📈 Resultados y Comparaciones

🛠️ Implementación Práctica

📊 Ejemplo de Uso en Generación de Contenido

📉 Rendimiento frente a Otros Modelos

💬 Conclusión

📚 Recursos Útiles

Introducción

Justo ayer, Anthropics publicó una entrada de blog que demostraba cómo puedes aumentar la ventana de contexto en su gran modelo mediante el uso de indicaciones. Ahora puedes aumentar la capacidad de recuperación del gran modelo de lenguaje en un 70% con una simple adición a tu indicación. Esto fue suficiente para elevar el modelo más nuevo de Claud 2.1 de una puntuación del 27% al 98% en una ventana de contexto de 200k. Echemos un vistazo a este ejemplo donde los investigadores agregaron una sola oración a esta indicación y dio como resultado una fidelidad casi completa a través de la versión más nueva de Claud 2.1 con su ventana de contexto de 200k. Vemos que esta indicación inicial que fue enviada por el usuario es lo que más diversión ofrece en San Francisco basado en el contexto. No proporcione información fuera del documento o repita sus hallazgos. Ahora, compararon esto con el otro ejemplo que tiene la adición de esta nueva oración que afirma que aquí está la oración más relevante en este contexto y solo con esta sola oración, Claud 2.1 fue capaz de elevar su puntuación del 27% al 98% en la evaluación original en términos de longitud del contexto. Ahora, esto es Algo que vamos a investigar mientras profundizamos en el documento de investigación, pero podemos ver que logró resultados significativamente mejores en la misma evaluación al agregar esta oración y esto es algo que vamos a explorar descubriendo qué es la ingeniería de indicaciones con la versión más nueva de Claud. Así que con ese pensamiento, chicos, manténganse atentos y vamos directo al video.

Comprender el Modelo Claud 2.1

Capacidades y Características

El nuevo modelo de Anthropics, Claud 2.1, es una innovación de vanguardia que cuenta con una ventana de contexto de tokens de 200k. Esto es equivalente a aproximadamente 500 páginas de información. Claud 2.1 sobresale en tareas de recuperación del mundo real a través de un contexto extendido, ofreciendo avances para empresas, como la reducción sustancial en las tasas de alucinación del modelo, mejoras en las indicaciones del sistema y la introducción beta de su nueva herramienta, entre otras características. Responde a las necesidades del usuario y es por eso que se centraron en la capacidad de procesamiento de información de Claud, con un límite de 200k tokens, lo que permite la carga de contenido extenso como bases de código, estados financieros y mucho más.

Mejoras de Claud 2.1 sobre Versiones Anteriores

Claud 2.1 se sometió a un extenso entrenamiento utilizando cantidades sustanciales de retroalimentación en tareas que involucran documentos largos, como resúmenes de documentos de longitud S1 y datos de entrenamiento que consistían en tareas del mundo real realizadas en documentos genuinos. Esto se hizo con el objetivo de minimizar errores y evitar reclamos no respaldados en las respuestas de Claud. Este enfoque de entrenamiento complejo del mundo real se refleja en el rendimiento de Claud 2.1, mostrando una notable reducción del 30% en respuestas incorrectas en comparación con su predecesor, Claud 2.0.

Método de Promoción: Maximizando la Capacidad de Recuerdo

Funcionamiento del Método de Promoción

Este enfoque implica guiar al modelo para priorizar la identificación de las oraciones relevantes que se necesitan para superar la reluctancia de Claud a responder preguntas basadas en oraciones aisladas. Esto es especialmente necesario para aquellas que pueden parecer fuera de lugar en un contexto más grande. Esto no solo resuelve la vacilación que ya existe con problemas que ya están en la generación, sino que también mejora la precisión de Claud al responder a oraciones individuales que encajan contextualmente.

Resultados y Comparaciones

Con este nuevo método de promoción, podemos ver que supera en generación con una ventana de contexto más grande en comparación con modelos como gbt 4, así como otros modelos de código abierto disponibles. Esto es algo que puedes incorporar en tu generación en este momento.

Implementación Práctica

Ejemplo de Uso en Generación de Contenido

Un ejemplo práctico es ilustrado por el caso de Yahoo Vib, que muestra el éxito de esta estrategia con una tasa de recepción precisa del 90 al 95%.

Rendimiento frente a Otros Modelos

Desde los gráficos, podemos ver que supera en generación con una ventana de contexto más grande en comparación con modelos como gbt 4, así como otros modelos de código abierto disponibles. Esto es algo que puedes incorporar en tu generación en este momento.

Conclusión

En resumen, el método de promoción introducido por Anthropics mejora significativamente la capacidad de recuerdo de Claud 2.1, permitiendo una generación más precisa y confiable. Esta técnica, combinada con las características avanzadas del modelo, lo posiciona como una herramienta poderosa para una variedad de aplicaciones que requieren comprensión y generación de texto de Alta calidad.

Recursos Útiles

Destacados:

Método de promoción que mejora significativamente la capacidad de recuerdo de Claud 2.1.
Claud 2.1 muestra una notable reducción del 30% en respuestas incorrectas en comparación con su predecesor, Claud 2.0.
Implementación práctica en la generación de contenido con resultados impresionantes.

Preguntas frecuentes:

1. ¿Qué es el método de promoción en el contexto de Claud 2.1?