跨组织和 OPA 的统一矢量访问: 在大型组织中,数据通常存储在不同的部门或合作公司的不同向量数据库中。由于法律合规性、数据安全和所有权等问题,将这些数据集中到一个中心非常困难。本次演示旨在提供一种无需复制数据的“虚拟集成”方案。
- 法律硕士: 用于将数据源中的复杂元数据转换为有意义且简短的自然语言摘要。它在理解用户查询和处理结果的过程中也扮演着高性能推理引擎的角色。
- 政策决定: 负责数据治理和授权。当用户发起查询时,OPA 会在运行时检查用户是否拥有访问该数据源的权限。
- 米尔沃斯细节: 它充当“语义目录”,以矢量形式存储所有组织中数据源的技术和业务元数据。当收到查询时,它会执行第一阶段搜索,以确定哪个组织可能拥有相关数据。
本次演示证明了如何通过结合 Milvus 的可扩展搜索功能、vLLM 的语言处理能力和 OPA 的灵活安全策略,在组织之间建立安全且“智能”的搜索基础架构,而无需将数据移动到中心位置。6
上下文工程: 演讲者凯文·诺埃尔认为,“写个提示然后等着回答”的时代已经结束了,取而代之的是,我们已经进入了情境工程的时代。
- 法学硕士是无国界的: 除非你提醒,否则模特甚至记不住上一句话。
- 国家创建: 要想让人工智能给出正确答案,你需要在“那一刻”(即时)将所有信息准确地呈现给它。这门艺术在于整合过往对话、文档信息和工具输出。
演示文稿显示,要成功实现人工智能响应,必须将以下几个部分结合起来:
- RAG(相关信息): 信息来源于公司内部文件或数据库。
- 内存管理: 用户过往偏好和短期对话记录。
- 外部工具: 数据来自 API 或计算工具。
- 系统命令: 决定人工智能特性和任务的主要规则。
手动测试如此复杂的结构(RAG + 内存 + 工具)是不可能的。演讲者提出了以下解决方案:
- 自动评估: 我们必须利用现有数据,让人工智能生成数千个“问答”对(合成数据)。
- 现实场景: 我们必须通过创建像真实用户一样提出错误或不完整问题的合成用户来衡量系统的稳健性。
成本和速度:我们可以利用合成数据集在几分钟内对系统的成功程度(准确性、不相关性、幻觉)进行评分,而人类进行测试则需要数周时间。 10