AI 时代,需要怎样的数据库?
10月23日,独立数据库厂商OceanBase在2024年度发布会上推出了OceanBase 4.3.3GA版本,该版本升级了向量检索与索引功能,实现了SQL与AI的一体化融合。这一版本深度融合了AI与数据库处理能力,支持多模态数据的融合查询,帮助企业简化AI技术栈,提高AI应用构建效率。OceanBase CEO杨冰表示,公司将继续践行一体化产品战略,为AI时代打造易用、高效的数据底座。
一体化数据库是AI时代的数据底座
随着AI技术的发展,越来越多的AI应用不再局限于纯文本生成,而是涉及多种复杂数据类型,并常存储于不同数据库中。这给数据库带来了新的挑战,包括提升性能与响应速度,处理和存储不同类型的数据,并支持结构化、半结构化及非结构化数据的复杂融合查询。杨冰认为,随着互联网/移动互联网时代向AI时代的演进,数据库正从分散走向统一,一体化数据库将成为AI时代的数据底座。
OceanBase 4.3.3发布,增加向量能力
面对AI时代的全新挑战,OceanBase不断推进技术升级。在2024年度发布会上,OceanBase推出了4.3.3版本,这是其面向实时AP场景的首个GA版本。OceanBase CTO杨传辉介绍,4.3.3在向量融合查询的关键能力上取得了显著突破,推出了全新的向量检索功能,实现了SQL与AI的一体化融合。
具体而言,4.3.3在多模态数据支持方面进一步扩展了对复杂数据类型的处理能力,新增了Array类型,并优化了Roaringbitmap类型数据的计算性能,为企业处理多样化数据结构提供了更高的灵活性。在向量融合查询能力上,4.3.3新增了向量检索能力,支持向量数据类型和向量索引,并基于向量索引提供了强大的搜索能力。用户可以通过SQL及Python SDK等方式灵活调用OceanBase的向量检索能力,结合对海量数据的分布式存储能力、多模数据类型及多类型索引的支持,极大简化了AI应用的技术栈,助力企业高效构建AI应用。
在多工作负载方面,OceanBase 4.3.3对AP(分析处理)场景进行了大幅性能优化,尤其是在海量数据分析时,能够提供更短的响应时间和更高的吞吐能力。同时,4.3.3引入了列存副本的新形态,实现了TP和AP负载的物理资源强隔离。这一物理隔离机制确保系统在处理事务型负载时,不受分析型负载的影响,特别是在实时数据分析和决策场景中,能够保持系统的高性能与稳定性。
测试表现优异
在发布会上,OceanBase与蚂蚁集团联合开发的向量库在业内标准的ANN Benchmarks基准测试中表现出色。测试结果显示,该向量库在ANN Benchmarks测试中性能远超其他算法,排名第一。特别是在90%以上的召回率区间,查询性能(QPS)相比此前最优算法glass提升了100%,相比基线算法hnswlib提升了300%。
云与AI结合的优势
杨传辉还强调,AI天然拥抱云,OceanBase作为一体化数据库,不仅具备云上云下一体化能力,同时具备多云原生开放架构,这些优势都能有效地帮助客户实现云与AI的结合,满足客户在云+AI时代的数据管理需求。
本文来源: 机器之心【阅读原文】