铠侠开源软件推动 AI RAG 的发展
通过优化固态驱动器 (SSD) 的使用,不断努力提高检索增强一代 (RAG) 系统中 AI 矢量数据库搜索的可用性,铠侠株式会社宣布更新其铠侠 AiSAQ™(带产品量化的全存储 ANNS)软件。
这个新的开源版本引入了灵活的控制,允许系统架构师定义搜索性能和向量数量之间的平衡点,向量数量是系统中 SSD 存储固定容量的对立因素。由此产生的好处使 RAG 系统的架构师能够微调特定工作负载及其要求的最佳平衡,而无需进行任何硬件修改。
铠侠AiSAQ软件于2025年1月首次推出,它采用了一种新颖的近似最近邻搜索(ANNS)算法,该算法针对SSD进行了优化,无需将索引数据存储在DRAM中。通过直接在 SSD 上实现矢量搜索并降低主机内存要求,铠侠 AiSAQ RAG 技术使矢量数据库能够扩展,在很大程度上不受 DRAM 容量限制的限制。
当系统中 SSD 的安装容量固定时,提高搜索性能 (每秒查询数) 需要每个向量消耗更多的 SSD 容量。这会导致向量数量减少。相反,为了最大化向量的数量,需要减少每个向量的 SSD 容量消耗,这会导致性能降低。这两种相反条件之间的最佳平衡因特定工作负载而异。为了找到合适的天平,铠侠 AiSAQ 软件引入了灵活的配置选项。最新更新使管理员能够为 RAG 系统内的各种工作负载选择最佳平衡。此外,此次更新使铠侠 AiSAQ 技术成为基于 SSD 的 ANNS,不仅适用于 RAG 应用,还适用于其他需要向量的应用,例如离线语义搜索。
随着对可扩展 AI 服务的需求不断增长,SSD 为 DRAM 提供了一种实用的替代方案,用于管理 RAG 系统所需的高吞吐量和低延迟。铠侠 AiSAQ 软件能够有效满足这些需求,允许大规模生成式 AI,而不受有限内存资源的限制。
评论