Con la creciente popularidad de los modelos de lenguaje extenso (LLM) y de las aplicaciones impulsadas por agentes, la observabilidad de estos modelos cobra cada vez mayor relevancia. En el pasado, hemos recomendado plataformas como Langfuse y Weights & Biases (W&B). Arize Phoenix representa otra plataforma emergente en este ámbito, con la cual nuestro equipo ha tenido una experiencia positiva. Ofrece funciones estándar como seguimiento de modelos (LLM tracing), evaluación y gestión de prompts, además de una integración fluida con los principales proveedores y frameworks de LLM. Esto facilita la recopilación de información sobre la salida de los modelos, la latencia y el uso de tokens con una configuración mínima. Hasta el momento, nuestra experiencia se limita a la herramienta de código abierto, pero la plataforma más amplia de Arize ofrece funcionalidades más completas. Confiamos en poder explorar en mayor detalle en el futuro.
