ColPali es una herramienta emergente para la recuperación de documentos PDF que utiliza modelos de lenguaje visual, abordando los desafíos de construir una aplicación robusta de generación mejorada por recuperación (RAG) que pueda extraer datos de documentos multimedia que contengan imágenes, diagramas y tablas. A diferencia de los métodos tradicionales que se basan en embeddings basados en texto o técnicas de reconocimiento óptico de caracteres (OCR), ColPali procesa páginas completas en PDF, utilizando un transformador visual para crear embeddings que consideran tanto el contenido textual como visual. Este enfoque holístico permite una mejor recuperación y una mayor capacidad de razonamiento sobre por qué se recuperan ciertos documentos, mejorando significativamente el rendimiento de RAG en PDFs ricos en datos. Hemos probado ColPali con varios clientes en los que ha mostrado resultados prometedores, aunque la tecnología aún está en sus primeras etapas. Vale la pena evaluarlo, especialmente para organizaciones con datos en documentos visuales complejos.