托管RAG可提高开发者生产力新服务实现嵌入、索引和连接器自动化助力开发者专注构建AI应用而非维护数据管道。对众多开发者而言构建AI应用的难点已从模型转向保持应用知识更新。检索增强生成RAG虽成为结合AI应用与企业数据的流行技术却带来持续运维工作如更新嵌入和索引、同步数据源及调整检索性能等。AWS新推出的托管服务Bedrock Managed Knowledge Base旨在减轻开发者大部分负担。该服务可自动处理企业AI应用背后的检索层。AWS高级解决方案架构师Daniel Abib在博客文章中提到“默认情况下该服务会自动为你选择并管理默认的嵌入模型、重排序模型和基础模型让你无需自行挑选或维护即可快速上手。”Abib还表示为在不构建和管理自定义集成的情况下维护数据管道该服务配备六个企业数据源的原生连接器包括Amazon S3、SharePoint、Confluence、Google Drive、OneDrive和网页内容。提升检索准确性Pareekh Consulting首席分析师Pareekh Jain称对于开发团队自动管理基础设施的能力能立即提升生产力。“企业花费大量时间构建数据连接器、管理文档摄入和索引、调整检索质量、实施访问控制以及维护向量数据库常使RAG基础设施比AI应用本身更复杂。有了这个服务开发者可专注于构建应用。”Jain表示“这将加快部署进度降低维护成本让团队专注于业务成果。”除减轻基础设施管理负担Managed Knowledge Base还致力于提高检索准确性。Abib指出该服务具备Smart Parsing和Agentic Retriever等功能旨在提高不同内容类型和来源的检索准确性这在跨越多个存储库的RAG管道和查询中常是难题。Jain认为对于想将AI项目从实验推进到生产阶段的组织提高检索质量尤为重要。“这是企业普遍面临的挑战因为业务数据分散在多个系统中。随着组织从AI试点转向生产检索质量对用户信任至关重要使RAG基础设施成为主要瓶颈常导致部署延迟。”Jain说道。AWS还将Managed Knowledge Base定位为智能代理应用的构建模块。Jain表示这类应用对企业知识和检索系统要求更高。据AWS称该服务与Bedrock AgentCore集成减少将企业知识源连接到AI代理所需的代码和配置同时提供内置的监控、评估和访问管理功能。对RAG工具生态系统的影响Jain认为这种集成方式可能影响更广泛的RAG工具生态系统。“像Bedrock Managed Knowledge Base这样的托管服务可能降低对独立RAG编排和检索框架的需求包括LangChain和LlamaIndex等工具以及一些向量数据库、摄入管道和检索服务的自定义组合。”Jain指出。不过Jain也提醒集成方式带来便利的同时存在权衡可能增加客户对单一云提供商的依赖限制AI基础设施的组装和管理灵活性。Amazon Bedrock Managed Knowledge Base目前已在北弗吉尼亚、俄勒冈、悉尼、东京、都柏林、法兰克福、伦敦和AWS GovCloud美国西部等地区推出。该服务采用基于使用量的定价模式费用与存储的索引数据量和处理的检索请求量相关。