胖头鱼的技术专栏-436 AI时代需要怎样的数据库?今天这场直播也许给出了答案(20260629)
数据库管理436期 2026-06-29胖头鱼的技术专栏-436 AI时代需要怎样的数据库今天这场直播也许给出了答案20260629胖头鱼的技术专栏-436 AI时代需要怎样的数据库今天这场直播也许给出了答案20260629作者胖头鱼的鱼缸尹海文 Oracle ACE Pro: Database PostgreSQL ACE 10年数据库行业经验 拥有OCM 11g/12c/19c、MySQL 8.0 OCP、Exadata、CDP等认证 墨天轮MVPITPUB认证专家 圈内拥有“总监”称号非著名社恐社交恐怖分子 全网同名胖头鱼的鱼缸 ITPUByhw1809 除授权转载并标明出处外均为“非法”抄袭AI Database这个名词对于我来说并不陌生毕竟我的这个基于数据库的AI Agent基础设施架构目前适配了的两个数据库之一就是Oracle AI Database 26ai如果回溯到2024年那时候它还叫Oracle Database 23ai的时候但是从名称里面已经看到Oracle将数据库推向AI的决策。上周在朋友圈我也看到了一款国产数据库OceanBase开启了一个新的线上活动OceanBase Hours首期嘉宾涵盖了OB的CEO、CTO和产品总以及蚂蚁平台技术事业部总架构师重量嘉宾云集可见OceanBase对本次直播活动的重视程度。而公众号预告文章的题目也是“下周一见OceanBase AI 数据库来了”看来OceanBase AI Database也到来了。今天正好有时间毕竟无业嘛可以全程看看这场线上直播但在开始之前先聊几件事。首先不知道大家发现没有最近OceanBase改Logo了除了图标改为单色以外字体也产生了些许变化尤其是“a”变化最大不知道和本次直播的AIDB有没有关系个人主观臆测仅供娱乐。另一件事呢其实也和AI时代数据库的很多概念有关从最早的DB4AI/AI4DB到后来的AI Ready再到最近“广为流传”的AI Native数据库的概念发展似乎比数据库本身的发展还要快很多但我也看到了不少的迷失。但是在我看来数据库是AI时代基础设施的最优选择我最近的工作也是基于这一观点进行的。而本次直播活动中OceanBase也提到了“AI数据库不是数据库的一个分支而是AI时代的基础设施重建”。在直播过程中OceanBase阐释了一个AI时代数据库急需应对的问题结合我的理解我对其进行了总结数据库使用方的变化在传统业务系统以外还有大量来自于AI Agent对数据库的操作未来AI Agent甚至会成为数据库使用的助力其中最大的变化就是业务场景从被动式响应变成了主动持续性操作数据模态的变化关系型数据仍然是核心但是它们需要与更加广大的多模数据进行联动对于数据类型就包含了向量、JSON、图、时序、GIS等数据而更广大的业务适配场景则还包含文本、图像、音频、视频等信息因此AI时代数据库就需要解决前面两个问题实现全场景全模态的支持OceanBase的答案是取自官方材料一体化多模态数据、离线与在线的计算统一在同一个强一致的底座上。数据不再被切割、不必在多套系统之间反复搬运那个越用越准的飞轮才转得起来多模态结构化、半结构化和非结构化数据需要在同一套体系中被统一管理和治理通过标量、全文、向量等方式进行混合搜索智能体的记忆天生跨越模态沉睡的非结构化数据也由此被真正盘活在OceanBase原来已有强大的单机分布式一体化多模态数据库基础之上通过下面的架构进化进一步实现AI时代一体化和多模态的数据库需求通过湖库一体架构实现了在任何数据规模和数据模态场景需求下都能够在一套数据库内实现将数据湖的开放格式与海量存储能力、数据库的结构化管理与在线服务能力统一起来把结构化、半结构化和非结构化数据纳入同一套元数据、权限、事务和生命周期管理体系。数据不必在多个系统之间反复搬迁和复制就可以直接支撑在线服务、实时分析和AI应用运行。在湖库一体的基础之上通过多模表让结构化字段、文本、图片、音视频、JSON、文本、向量等数据形态进入同一张表的语义之下。虽仍然是一张表其实承载更丰富的数据资产并在同一套治理体系中被检索、计算和调用。在多模表之上AI列进一步把模型能力引入数据处理链路。基于原始数据生成摘要、标签、特征、向量或其他语义结果让模型理解能力以“列”的形式进入数据库配合OceanBase早已实现的成熟的多模数据混合检索能力让非结构化数据成为可搜索、可计算、可治理、可被Agent安全调用的数据资产。但是数据库仍然有需要自己坚持的地方——数据安全这里需要包括容灾备份无论是生产数据库还是Agent的运行数据都需要有效的安全防护且数据库需要能够持续的提供服务。因此数据库的容灾备份能力仍然是AI时代数据安全且持续有效的最优选择数据隔离针对不同Agent的运行数据需要由数据库支持完整的隔离与共享机制能力以确保AI时代数据安全的另一份保障并可实现数据可控的共享实现多Agent的高效协作可审计追溯针对重要来源的数据数据库还应当做到操作可记录、可审计必要时还需要实现防篡改…上面这些能力其实都是数据库的传统能力是需要被坚持且不断完善的这些是企业AI落地的坚实地基。在直播中我还看到一点和我做的系统不谋而合即OceanBase AI数据库设计原则之一Agent友好Agent所需的记忆、上下文、隔离、分支、回滚与规模化运行能力不应该依赖外部系统拼装而应成为数据底座的原生能力要实现这一目标谈何容易回到OceanBase的一体化和多模态这就是答案通过湖库一体、多模表与AI列、多模混合检索等能力满足全业务场景与全数据模态让AI时代所需的任何操作不再被数据量、并发量、数据链路等因素被束缚可以自由的使用统一的数据存取方式在一套数据库中自由的操作降低Agent在数据库底座中的工程化落地成本。对照我的系统OceanBase AI数据库所展现出来的东西也让其下一步适配的重点目标。结合我的开发经验以Skill作为系统载体充分调用数据库的各类MCP我也期待看到OceanBase进一步完善AI数据库的周边生态。最后以直播中OceanBase AI数据库的一句话含义结尾OceanBase AI数据库是以湖库一体为核心架构、面向Agent和多模态数据设计的现代数据基础设施。它将数据库的事务、一致性与实时处理能力与数据湖的开放、海量存储和多样化计算能力统一起来把结构化、半结构化、非结构化数据纳入统一管理体系打通在线服务与离线分析消除多系统拼装带来的数据割裂、链路冗余与工程复杂性为现代AI应用提供可靠、实时、可扩展的数据底座。老规矩知道写了些啥。