发布于 : Apr 02, 2025
Apr 2025
评估
随着大语言模型和AI agent 应用的日益普及,LLM 可观测性的重要性不断凸显。此前,我们曾推荐过 Langfuse 和 Weights & Biases (W&B) 等平台。 Arize Phoenix 是该领域另一个值得关注的新兴平台,我们团队在实际使用中也取得了积极的体验。Phoenix 提供了诸如 LLM 链路追踪、评估和提示词管理等核心功能,并可与主流 LLM 提供商和开发框架无缝集成,以在低成本、低配置的情况下实现对 LLM 输出内容、延迟和 Token 消耗等指标的深度洞察。目前我们仅限于对其开源工具的使用经验,而更全面的商业版 Arize 平台拥有更多高级能力,我们也期待未来对此进行进一步探索。