O turbopuffer é um mecanismo de busca multi-tenant e sem servidor que integra perfeitamente buscas de vetor e de texto em armazenamento de objetos. Nós gostamos de sua arquitetura e escolhas de design, especialmente por seu foco em durabilidade, escalabilidade e eficiência de custo. Ao usar o armazenamento de objetos como um log de escrita antecipada (write-ahead log) enquanto mantém seus nós de consulta sem estado, ele é adequado para cargas de trabalho de busca em larga escala.
Projetado para performance e precisão, o turbopuffer entrega alto recall nativamente, até mesmo para consultas complexas baseadas em filtros. Ele armazena em cache os resultados de consultas frias em SSDs NVMe e mantém os namespaces frequentemente acessados em memória, permitindo buscas de baixa latência em bilhões de documentos. Isso o torna ideal para recuperação de documentos em grande escala, busca vetorial e geração aumentada por recuperação (RAG) em aplicações de IA. Entretanto, sua dependência por armazenamento de objetos introduz compensações na latência das consultas, fazendo com que ele seja mais eficaz para cargas de trabalho que se beneficiam de computação distribuída sem estado.
O turbopuffer alimenta sistemas de produção de grande escala como o Cursor mas atualmente está disponível apenas por indicação ou convite.
