作者:苏程辉,趣丸数据库负责人
如今,大模型推动各行各业加速智能化转型已广为人知。而在实际应用过程中,#大模型 对特定领域或私有数据的无知导致其难免存在“#幻觉” 问题,催生了企业对高效、精准的“记忆系统”的迫切需求。向量数据库作为连接大模型与海量非结构化数据的核心桥梁,以其强大的相似性检索能力,迅速成为构建新一代#AI应用(如智能问答、推荐系统、语义搜索等)的基础设施,直接决定了AI应用的智能高度与用户体验。本文分享趣丸科技定制化AI助手在选型底层数据库时,对比多款向量数据库后选择OceanBase的思路和经验。
趣丸科技成立于2014年,是一家集兴趣社交、人工智能、电子竞技等技术于一体的创新型科技企业,1600+的员工中有50%为技术人员,软件著作权和专利近500项,成为了中国互联网综合实力百强企业、#广州互联网企业20强。
作为一家先进的科技企业,对新技术的态度是敞开怀抱。近两年,AI 技术的成熟和应用对趣丸内部各个部门产生了积极影响,趣丸希望借助 AI 提升效率,降低人力成本,尤其在数据库中间件的日常场景和运维监控场景。
日常场景对AI 的需求可归纳为四类:
在运维监控侧,计划将 AI 能力应用于以下两个方向:
基于各部门的不同需求,公司面向员工推出统一的服务入口——员工助手。每位员工都需要拥有独立的私有助手,满足定制化需求。这对底层数据库又提出四项核心需求。
在员工助手的开发过程中,数据库团队在调研 AI 应用的行业现状、开发难度和稳定性保障等,发现现实远比想象中更具挑战。
首先,目前行业内尚未出现一个成熟、开箱即用、可支撑 AI 应用快速开发的底层数据库。
其次,要满足多种需求,可能需要同时维护 MySQL(标量检索、支持 TP)、Elasticsearch(全文检索、向量检索)、VDB/Milvus(向量数据库),至少三套系统,大幅提升了引入成本和开发难度。
最后。每个组件的稳定性都需要单独保障,包括高可用、监控、备份及故障排查等,运维工作量大,定位链路长。
基于业务快速落地与稳定性的双重要求,数据库团队优化了选型方案,核心诉求如下。
在该目标指引下,初步选定三套数据库方案,并进行对比。
方案一:MySQL + Elasticsearch+ Milvus/VDB
如上文所述,采用该方案需要维护三套独立系统,数据同步链路长,开发、测试与发布周期成倍增加。同时硬件投入与人力运维成本均高,不符合“低成本快速上线”目标。
方案二:TiDB+ ES
此外,TiDB需手工或通过 TiUP 组件部署,自动化与平台化程度低于 OceanBase,运维便利性不足。
方案三:OceanBase

综合性能、兼容性、持久化、扩展性、成本、运维便利多个维度,最终选择 OceanBase 作为统一数据底座。主要出于五点原因:


此外,在调研过程中,趣丸也发现 OceanBase 具备三个突出优势,也是其他方案不具备的能力。
一是OCP 运维平台提供图形化、自动化集群管理能力,显著降低日常运维复杂度,可实现一键扩缩容、监控告警、备份恢复、补丁升级及故障自愈等常用的运维操作。
二是副本级列存。在不增加额外组件的前提下,通过将其中一个副本以列式存储呈现,即可满足轻量级分析需求。
三是数据高压缩比。OceanBase 提供多级数据压缩能力,压缩率可达 3:1~5:1。虽然单 TB 磁盘单价较低,但当数据规模达到数十 TB 且用于长期归档时,高压缩特性可直接减少机器数量,形成可观的成本节约。

目前基于 OceanBase 的员工助手已经上线,运行平稳,CPU使用率长期稳定在15%以下,抖动很小,整体平均响应时间满足业务的需求。


之所以该业务得以快速上线,关键在于开发效率提升、运维标准化、成本节省这三个方面。
提升开发效率: OceanBase 支持标量、向量、全文等混合检索,通过一条 SQL 即可解决复杂的多维查询需求,简化开发逻辑,降低编码复杂度。
运维标准化: OceanBase的迁移工具和运维平台方便易用,简化了部署与监控,可以快速上线,减少部署时间。
成本节省: 相较于三套数据库才能满足业务需求的方案,采用三合一的数据库底座,减少了资源的申请和审批流程,且大幅节省资源消耗。
在上线OceanBase的过程中,运维团队遇到两个问题,可作为注意事项以提醒大家。
第一,OceanBase 的初始资源占用较高,在尝试验证生产环境所需的资源规格时,运维团队发现常规的资源配置如 8C16G,无法成功完成部署。尤其是在安装 OCP 等全套组件时,可能会存在资源不足的问题。因此,部署生产环境建议配置较高规格的资源如 8C32G。
第二,在性能测试中,运维团队在 OceanBase 中使用了业务中常用的租户配置,如 2C4G、4C8G,测试结果表明,在该配置下 OceanBase 的性能未能达到预期。建议使用较高规格的租户进行测试,避免产生性能不达标问题,同时也能对真实业务环境的性能表现有所把握。
员工助手是趣丸内部面向员工使用的服务入口,后续将其接入其他 #AI产品 中。因此,对于AI应用的底层数据库 OceanBase,趣丸也有几点期待:
最后为大家推荐这个 OceanBase 开源负责人老纪的公众号「老纪的技术唠嗑局」,会持续更新和 #数据库、#AI、#技术架构 相关的各种技术内容。欢迎感兴趣的朋友们关注!
「老纪的技术唠嗑局」不仅希望能持续给大家带来有价值的技术分享,也希望能和大家一起为开源社区贡献一份力量。如果你对 OceanBase 开源社区认可,点亮一颗小星星✨吧!你的每一个Star,都是我们努力的动力。
登录查看全部
参与评论
手机查看
返回顶部