资讯详情

寒冬之下持续吸金,蛰伏30年的国产数据库终迎黄金时代?

作者|真梓(微信)ID:315159284)

Ray(微信ID:raylazy)

石亚琼编辑

不仅国内半导体企业,国内数据库厂商也很多。据36氪前不久统计,2020-2021年有40多家国内数据库公司获得融资。仅2021年,就有20多家企业获得了新一轮融资。

这股风潮一直延续到2022年。近期,36氪分别报道了云原生实时数仓厂商「飞轮科技」天使轮和天使 轮换融资超过3亿元,分布式数据库和AI PaaS平台「天云数据」数亿元D轮融资的消息。值得一提的是,融资超过3亿元「飞轮科技」,成立不到半年,不得不说是一个非常亮眼的融资成果。

更多被风险投资布局的项目仍然隐藏在水下。36氪了解到,即使在冬季,仍有一些具有大工厂光环的初创公司将以超出想象的价格完成新一轮融资。

至少在过去,中国数据库领域从未发生过这种持续的融资景象。

数据库作为一种基本软件,起源于美国,在欧美发扬光大。国内数据库的应用长期处于追随者地位。自20世纪80年代以来,一个核心节点是IBM、Oracle海外关系数据库制造商进入中国,赢得金融、电信等领域的核心客户后,国内关系数据库市场(特别是OLTP)几乎被外企垄断。由于起步较晚,错过了这一主流战场,国内数据库企业很少。直到2010年,只有两位数的公司能叫出名字。

另一方面,在公开盘点中,已有200多个国内数据库浮出水面。不仅有历史悠久的关系数据库,还有图形数据库、时间序列数据库等新数据库。在每个细分领域都有VC早期项目高价追逐。

如果深入研究半导体爆炸的想法,国内风险投资风向的转变可能被视为这一现象的动机。但更重要的逻辑是,一方面,中国在过去10年中深入参与了移动浪潮,并在电子商务、游戏、直播等场景中打磨了它IT能力;另一方面,自1999年第一批国内数据库企业成立以来,制造商已经开辟了20年的实践道路,相对降低了与国际竞争对手的能力差距。

因此,市场需求的迭代和制造商不断积累的产品能力是改变游戏规则的主要原因。在此基础上,本地替代和全球开放的机会使国内玩家更接近舞台的中心。

正确的时间和地点,起源于2020年至2022年的国内数据库投资热,实际上是技术演进和需求迭代的必然结果。投资趋势更加核心,成为这种不可避免的加速器。

为了进一步观察这一变化,本文将从数据库技术演变的角度探讨国内数据库的增长原因,并分析国内数据库基于新的第一手信息和历史数据面临的机遇和挑战。具体来说,我们将重点关注以下问题:

1.多种类型数据库的演变逻辑和分类维度

2.当前数据库领域的技术规律

3.国内外数据库制造商成长环境的差异

4.目前数据库制造商的不同商业路径和分野原因

5.选择不同商业路径的数据库制造商将面临什么挑战?

在文章的最后,我们还将对相关制造商进行分类,向读者展示更全面的国内数据库地图,以帮助读者进一步了解行业和当前行业的全景。

数据库作为一种历史悠久的基础软件,与快速变化的数据生态密不可分。在过去的60年里,随着信息化、数字化和智能化的浪潮,数据的规模和使用发生了巨大的变化。

根据国际数据公司(IDC)近年来,全球大数据储量增速保持在40%左右,2016年增速甚至达到87%.21%。具体数据显示,2016-2019年四年全球大数据储量分别为16%.1ZB、21.6ZB、33.0ZB、41ZB,储量迅速上升。

当数据量迅速上升时,基于大数据的各种应用程序层出不穷。承载这一切想象力的基本软件数据库也从图形数据库、时序数据库、流式数据库、内存数据库、向量数据库、数据湖等早期关系类型演变为多种功能形式。产品架构也从单机向分布式、云原生等形态扩展。证明,现在DB- Engines大约有400个数据库被覆盖。

看着复杂的产品形式,很难想象数据库最初想要解决的问题其实很简单。

六十年代,IBM当先驱开发了第一个用于管理数据的系统时,数据库的名称就出现了。当时,数据库主要用于管理仓库库存清单、图书馆借阅记录等信息。要解决的两个核心问题是信息的存储和查询。

例如,当图书馆中的一本书被借走时,相应的借阅信息可以被记录并写入数据库,读者可以根据数据库中的信息直接查询该书是否已归还。人们发现,将数据分成不同的表单并对应联系可以更有效地管理信息。该数据库也被称为关系数据库,是最传统和最常见的数据库类型。

后来,随着数据类型的变化,人们逐渐开发了适应不同场景的新数据库,如专注于文档存储的文档数据库、记录传感器每秒产生的数据的时间序列数据库等。

而随着数据量的增大,一台机器已无法满足数据的存储与处理要求,因而出现了新的数据库架构,如采用多台机器的分布式数据库、基于内存的内存型数据库。

在云计算时代,出现了基于云平台的云原始数据库,使数据库也能享受到云计算的灵活性和便利性。从管理一个小图书馆到互联网时代的大数据分析,随着数据量的扩大和数据类型的增加,有越来越多的数据库用于不同的场景和架构。

一个基本事实是,世界上至少有数百种数据库产品。作为一种查询、存储、修改和分析数据的软件,数据库也有各种不同的分类方法,每个分类都有自己的重点。

因此,我们将综合技术演进、用户存储查询的数据特征、数据规模和行业认可度从四个角度对数据库进行分类。

数据库分类维度

数据格式通常分为结构化(structured)数据和非结构化(unstructured)非结构化数据包括文档类型(document)数据和键值对(key-value)等多种类型。

在数据库领域,最常见的是结构化数据,它们有固定的格式。例如,在网上购物时,通常会有订单号和用户 ID、商家 ID 对于不同的网上购物交易,每个交易信息的格式都是相同的,因此用户可以提前定义数据的格式(schema),此时,通常使用关系型(relational)存储数据库。一些数据更注重文本信息,如微博和博客,有大量的文本信息,这与文档类型相对应(document)数据库。有些数据是简单的键值对(key-value),例如用户的 ID 这些信息通常与头像一一对应,可以存储在键值对型数据库中。

数据库可分为单机型、分布式和云原生型。单机型数据库通常只在一台机器上运行,因而维护起来比较简单,但扩展能力有限,比如最常被用作个人博客后端的数据库 MySQL,足以胜任数百个博客的备份存储和每天数千次访问;分布式数据库通常部署在由多台机器组成的集群中,当一台或多台机器损坏时,可以通过多台机器之间的备份机制,确保业务不受干扰;云原生数据库部署在云中,如阿里云或 AWS 数据库制造商对机器进行维护和管理,用户只需按读取次数和存储空间大小支付费用。

数据库有 OLTP、OLAP 和 HTAP 三大类。OLTP 类数据库通常用于支持在线交易。例如,在网上购物时,每个新订单对应一个新的数据记录,OLTP 类数据库需要在很短的时间内存储这个新记录;OLAP 类数据库对离线数据进行了更多的分析。例如,在分析商户当月的总销售额时,您需要扫描当月的所有订单并积累其财务。此时,您需要阅读多个记录,但用户通常可以等几分钟到几个小时;HTAP 同时支持类型数据库 OLTP 和 OLAP 实时数据监控有两种类型的操作。例如,当检测到订单量突然下降时,HTAP 类型数据库可以提醒用户检查系统并及时排除故障。

除了上述常见的数据格式外,用户还会在一些特殊的使用场景中使用特殊的数据库。对于物联网设备产生的信息,时间数据库将根据数据产生的时间组织底部存储结构,更高效;图形数据库更适合抽象的点和线信息,如银行交易流程,每个账户可以作为一个点,两个账户之间的转账可以作为一个边缘,图形数据库可以更快地追溯资金的方向;此外,文本检索、流式数据分析等常见场景MapReduce 这些相应的大数据工具,也可以看作是广义的数据库扩展。

市场上的数据库公司都有自己的重点不同公司之间的业务重点不同,也会重叠。因此,在多个维度下,特定的数据库通常被分为多个不同的类别,如 MySQL,既是结构化数据库,又是单机型数据库和 OLTP 型数据库。

数据库种类繁多已经是不争事实。不过从更宏观的产业迭代角度,数据库领域的技术演进,已经随着需求变迁而产生一定共识。在这一层面,通过查阅资料并盘点新兴的数十家数据库公司,我们发现在全球范围内,数据库领域已经产生如下技术趋势:

多家公司都选择将核心代码开源来获取用户,扩展功能闭源来产生利润。选择开源并与社区共同开发数据库内核的有国外的PostgreSQL、MongoDB与CockroachDB,国内的TiDB等。这样做的好处是降低用户尝试的成本,毕竟对于开源代码,用户可以自己免费编译、部署与试用。同时,用户也可以根据自己的需要去直接调整源代码,使数据库更切近自身需求。此外,来自开源社区的爱好者们也可以贡献自己的代码,讨论相关功能,并可以从源代码的层面去解决用户遇到的疑难杂症。再者,开源也被不少中小公司视作获得客户信任的一种方式。

不过,关于开源和商业化之间的争论也从未停止。于是,对于一些进阶功能,商业公司可能会选择闭源,比如MongoDB的企业级数据保护功能是闭源并收费的。而部分云数据库则选择始终闭源,如Snowflake,毕竟大部分用户并没有能力在云端部署云原生的数据库,而只能直接使用云数据库的相关服务。

在互联网时代之前,单机型数据库,如MySQL,可以满足大多中小网站的数据需要,而银行则使用中大型机,单价不菲。在如今的大数据时代,单机已经没办法满足人们对数据库的性能要求,而分布式技术,通过增加机器的数量,可以更经济实惠的解决用户的数据需求,近些年新兴的数据库公司也多采用分布式的架构,如TiDB、MongoDB等。开源与分布式同时也为用户提供了更多选择,用户不再被局限在某两三种数据库的选择题里,而运行这些数据库的机器也可以是性能较好的家用机,不再是以前成本令人生畏的中大型机,更多的中小公司有能力选择性能更为强大的分布式集群作为数据解决方案。

有国内从业者指出,分布式和单机型数据库适用的场景不一。具体而言,他认为由于分布式相较于单机会存在性能瓶颈,所以跨节点的大数据量查询场景可能会存在瓶颈。另外,数据库的投入需要衡量不同架构的硬件成本、运维成本等多个维度,采用何种架构才能降本增效是一个综合性命题,不能一概而论。客户应该依照自身业务需求综合评判。

如蚂蚁集团的时序数据库CeresDB就基于OceanBase 分布式存储引擎底座。这样做的好处是提高了代码的使用率,减少了重复劳动,同时,数据库的各个层次都可以交由专门的团队负责,提高工程师的专注度。此外,新的架构也带来了新的挑战,如在单机型数据库中,数据的存储与计算天然就在同一台机器中进行,而对于分布式和云原生数据库来说,则需要想办法进行存算分离,以便于存储层和计算层可以独自扩展,有些用户可能需要更多的存储空间,其它用户则可能需要更强的计算能力,这样大家可以各取所需。

在最近的三十年里,对用户来言,数据库从最初需要付费购买使用许可的软件,变成了可以自己编译运行的开源代码,再变成需要自己采购多台机器组成机群来调度使用的分布式系统,最后又成为只需要按数据的读取次数付费的云数据库服务(即Database-as-a-service)。

云原生数据库让用户省去了数据库集群维护、性能扩展的烦恼,也带来了新的按读取次数收费的模式:比如在微软CosmosDB的serverless收费模式下,用户并不知道微软到底维护了多少台机器,只需要关心自己对CosmosDB的读取次数并以此付费,数据库集群的扩展管理工作则由用户交给微软来统一调度负责,用户则可以减少工程师团队规模并降低宕机风险。

费用与安全性方面,对大部分中小公司来说,使用大厂的服务也比自行维护数据库集群更经济可靠,毕竟大厂可以招聘成百上千的数据库领域专家来专注提升数据库服务。此外,云厂商的数据库通常会与云厂商的主机有更密切的结合,用户会更倾向于在某家云厂商进行一站式的采购,使用同一家云厂商的主机与数据库。只是这样用户也加大了对云厂商的依赖,当云服务中断的时候,用户的业务通常也会受影响。

依托于云平台,用户可以在美国的东西海岸,或者中国的北京、深圳等地轻松建立多个数据中心,使用本地的数据中心来服务本地用户,以此减少消息延迟并满足数据本地化的合规要求,并且,用户也可以在异地进行数据备份。而在云时代之前,这些多地操作需要很高的成本,因为这意味着要在不同地区部署多个机房,当时只有少数大厂才能做到。

传统数据库分为OLTP(在线交易型)与OLAP(在线分析型)两大类型,而近些年HTAP(混合型)数据库也更受欢迎,成为新的业界发展方向。这是因为在大数据时代,数据的分析价值越来越大,比如抖音等软件,需要根据统计结果来提升自身推送服务的精准度,这就需要数据库与机器学习等工具有更紧密的融合,也需要数据库能更高效得存储并查询海量数据。此外,新兴的数据使用场景也带来了新兴的数据库细分市场,如文档型数据库多使用MongoDB存储,物联网数据则需要流式数据库或者时序数据库来实时存储查询,也带来了新的创业机会。

 

产品力是科技公司的立身之本,商业化是公司综合能力的"试金石"。但早前,由于技术源自国外、市场多被外企垄断等因素,国内数据库厂商一直带着"追随者"的标签踽踽前行,商业想象力并不充足。

不过近5~10年,情况发生了显著变化。在墨天轮的盘点中,我们可以看到有超过200个国产数据库已浮出水面,这其中不仅包括历史较久的关系型数据库,还包括图数据库、时序数据库等新型数据库。

抽丝剥茧地去看,这种现象的出现,和国内数据库行业的持续积累息息相关。

其实在早前,中国数据库学术研究的开展并不算晚。1977年,数据库学组成立于安徽黄山会议,当时即定位于进行该领域的教学、科研等。但不可否认,国外产品在应用落地上的持续抢先,让国内客户首先采用了国外产品,也让国产厂商在实践中也多依赖于开源产品,从而错失了自主产品的产业化机会。

但在近20年里,由于新场景的出现和移动浪潮的兴起,国产数据库的实践也多了起来。最典型的例子就是,互联网厂商出于自身的业务诉求,而自行开展数据库产品的打磨。

也正在这些实践中,国产数据库的产品应用逐步和国际接轨,缩减了差距。

前文提到,全球数据库领域已经产生代码开源、分布式架构、分析能力更被看重等技术趋势。这些技术几乎已形成全球共识,中国也不例外。

比如,分布式系统的理念主要来自于Google于2003~2006年发布的三篇论文。在这段时间里,国内第一批数据库公司,人大金仓、武汉达梦、南大通用相继成立。曾有老牌国产数据库高管告诉36氪,公司在10年前支持某大型央企的数据仓库建设时,就被明确要求采用分布式技术。

开源在国内的兴起也值得一提。过去许久,开源在国内一直是“小众运动”。但2021年,随着PingCAP等公司更为人所知,再加上国内扶持基础软件生态的决心,开源也迈上新台阶。2021年,开源被写入《“十四五”软件和信息技术服务业发展规划》,这被视作开源在国内取得的一项里程碑。顺此趋势,36氪也观察到长期处于强监管要求下的金融领域,也在2021年开展了一系列开源软件使用方式的探讨。不过另一方面,年底Log4J 2安全漏洞的爆发,又让开源软件的安全性备受质疑。企业如何在开放中平衡安全,成为新的话题。

不论是早期就被顺利实践的分布式趋势,还是突如其来的开源热潮,都意味着在过去20年间,国产数据库厂商一直在关注国际趋势,并积累了一定技术能力。再加上国产化、云生态带来的新市场机会,时至当下,众多国产数据库迎来万象更新的时代。

以占据市场主流关系型数据库为例,过去在中国乃至全球OLTP市场中亮相的常是外企,直到2015年左右才零星出现了几家新兴的国产厂商。但近期36氪观察到,至少在不少厂商对外发布的信息里,OLTP产品的数量已经超出了预期(当然,其中不少是基于国外开源产品的迭代)。其中除却新兴厂商的面孔,也有老牌数据库公司发布相关产品。

另一方面,图和时序等方向的国产厂商也不断涌现。比如在图数据库中,当前我们观察到的国产产品就有十余个。而且由于这些领域整体较新,国产数据库厂商暂时还不需要挑战完全具备垄断优势的巨头。曾有国产图数据库厂商对外表示,当前全球范围内的图数据库公司,不少都还走在完善产品的过程中。

——当国内产业不再和国际脱轨,数据库厂商们面前呈现出国际化和国产替代两种商业路径。

不可否认,当前国产数据库的产品力还有提升空间。比如不久前曾有一些调研显示,国内OLTP类数据库在部分场景中(如数据量大、高并发、变化速度快)和Oracle等公司的产品依然存在差距。

但值得肯定的是,如今这种商业路径选择权的出现,在过去漫长的蛰伏期里是难以想象的——毕竟只有满足了技术基本不脱钩的基本条件,全球化或者国产替代的机会才能摆在眼前。而在这个迄今为止,国内数据库行业最好的时代中,当前国产厂商们面临的“幸福烦恼”是,选哪条路更合适?

在主营国际化的路径中,一些新兴的国产数据库公司多强调云原生、数据库即服务等标签,希望让产品区别于上一代数据库。产品之外,这类新兴厂商的集中特点大致包括,创立时间不久(多成立于2017年—2021年之间)、拥抱开源、受双币基金追捧等。

而在国产替代的世界里,在满足资质的条件下,不少成立许久的国产数据库厂商主要基于关系型产品延伸,希望帮助客户完成降低成本和自主可控的目标。在这一目标的指引下,这些厂商多具备成立时间较久、投资方多为人民币基金,以及主打国内大中B客户等特点。

在欧美市场,公有云与数据库结合的路径已被证明可行。Gartner近期的一份报告显示,全球数据库厂商的市场份额正借助云的能力获得增长。报告中提出,过去10年间,坚定公有云战略的厂商,在数据库市场份额中的排名大多获得了提升,这其中不仅包括亚马逊、谷歌等自有数据库产品的公有云厂商,也包括独立数据库公司Snowflake等。这样做的好处很明显,首先,数据库公司可以和云厂商一起服务同一个客户。另外,数据库公司还可以复用云厂商的生态,减少不必要的资源消耗。而数据库即服务的模式,也建立于云基础之上。

这也是不少关注出海的国产数据库厂商,和看好它们的投资人所认可的方向。但回到国内,由于国内外在商业环境上的差异,这一模式难以完全复制。

原因不难理解。将公有云与数据库的结合落地,需要云厂商、数据库公司和客户的多方协作。以被国内对标多次的Snowflake为例,其目前支持Amazon AWS、Google Cloud与微软Azure三家云平台。在不少解读中,它也因为在公有云上具备中立第三方的身份而崛起。时至今日,Snowflake依然不支持私有云环境。

回到国内,Gartner在今年三月发布的指南中提出,国内甲方业务向公有云迁徙的趋势,是中国数据库市场增长的一大动因。不过,这一趋势至少在当前并未大规模落定,不少大B客户依然会出于安全、信任等方面的考虑,提出私有云或专有云的建设、更新需求。而且,目前国内私有云的市场格局也相对分散,这导致的一个现象是,底层架构不统一,国产数据库公司单纯依赖公有云厂商合作的必要性没有海外充足。

具体在产品落地层面,36氪了解到,早前由不同云厂商搭建的私有云和现在公有云的平台架构有所差异,针对公有云环境的数据库并不能被无缝部署到不同的私有云上。对比国外,美国的私有云与公有云的标准会更统一一些,如微软为美国国防部以及一些美国公司(如可口可乐)搭建的私有Azure云平台虽然在物理上与公有云独立,但在底层架构上会更兼容现有的公有云软件,也为云数据库公司向这些私有云的客户销售自家产品提供了可能。

产品架构不统一、格局分散只是一部分难点。下一个问题是,目前还有不少私有云厂商也会主打信创云路线。而能做进国产替代市场的企业,往往需要具备背景合格、产品适用于党政和金融等业务场景、服务细致等能力。面对这些要求,独立数据库厂商应该找准自身定位。

另一方面,当前国内云生态竞争愈发激烈,云厂商的自有产品如何与独立数据库厂商合作,也是下一个值得讨论的问题(当然,这一问题海外也存在)。这种情况下,独立数据库公司能否依靠产品力等其他特点获得合作伙伴和客户的肯定,更成为重中之重。

总体而言,国内厂商短期内或许无法将海外优解复刻到国内。这也在很大程度上造成了数据库公司商业路线的分化——对大多数人而言,是出海寻找真正的公有云+数据库模式,还是抓紧国产化浪潮,此时更像是单选题。

曾有长期深耕数据库领域的投资人告知36氪,数据库公司的商业化路线,几乎从创业第一天起就板上钉钉。在全球化和国产化的两个不同世界里,厂商亦要具备不同的通关能力。

在出海路线中,国产数据库厂商首先会遇到产品上的竞争,同时也要适应不同国家客户的使用习惯和销售方式。

这三大关卡的任何一环出了差错,都可能导致全球化战略的失败。在这其中,——如果技术底蕴不深,产品做不到全球范围内的相对领先,那么征战海外大概率是场竹篮打水。而在这一前提之下,销售、市场方面的门门道道,也在持续影响着企业出海的成功率。

这样的例子不是没有发生过。36氪了解到,五六年前曾有一家细分领域的头部软件公司决定征战北美市场,但最终却由于产品无法适应当地而败北,"其实它的产品能力很强,但美国和国内的数据传输格式不同,给国外的产品基本要重做。"一位接近这家公司的行业人士回顾。这导致的结果是,这家公司重新打磨产品花费成本过高,难以在不同市场中平衡,最终中美两边的业务都受到一定影响。

但经过一段时间的持续摸索,在一些头部公司眼中,如今这三重挑战似乎都能指向同一个解法——“开源+云”,这是既受国外同行的启发,也是国内企业在出海需求下的自主摸索。在这一思路中,开源是依靠全球开发者的力量收集反馈、打磨产品的方式。同时,这也能让产品更契合当地客户使用习惯,并产生对品牌的认知。而云战略的好处上文也已提及,不仅能让数据库等基础软件厂商复用其生态能力,还能让公司的整体运营更标准化。

在理想状况下,这是一条将产品打磨和商业化紧密结合的路。但回到现实,不论是建设开源生态还是坚持云战略,都需要付出不少努力。

做到这件事的基本前提包括,挑选可以协作的云厂商,并基于此将产品打磨标准、适合云交付,以及培养公司的服务能力。

首先,选择合作伙伴可能牵涉到厂商的技术投入。实操方面,数据库厂商自身的技术架构通常也会依托并受限于底层云平台。如Snowflake早期选择依赖AWS的S3作为存储层,数年后才支持了Google与微软的云平台。

另外,践行云战略的过程中还会存在一些另类的考验。"现在要思考的是,我们要从一家产品、技术导向的公司,转而更强调自己的服务、运营能力。"有正处于转型期的公司高管坦言。这是公司整体定位的转变,其中必然伴随着不少企业文化、组织,乃至心理上的冲击。“但这可能也是优势,毕竟我们是真的勤劳,服务体验可能更好。”有员工这样鼓励自己。

在很多人的共识中,一家公司是否能做好开源,可能是“气质”决定的。一般来说,理想的创始团队需要具备国际化视野,比如拥有在国外技术领域长期求学、工作的经历就是一个加分项。另外,团队还要对当地销售习惯有所认知,做好商业化和开源之间的平衡。

这些基础要求听起来似乎不难,但具体的落地节奏却仍值得细致推敲。

36氪在过去一段时间内发现,国内有不少数据库团队正在规划出海细节。但就算是一些在国内已经搭建起开源生态,受到使用者肯定的厂商,在面临出海时依然会产生担忧。

“主要是担心文化问题。开源生态的建设在不同国家也存在文化差异,让融入当地更加困难。”有建设开源生态近五年的数据库厂商负责人表示,其公司在建立海外分部时,会计划将国外办事处和国内分开独立运营,希望降低双方互相干扰的可能性。类似的细节还能数出不少,比如有创业者要求公司所有的文档都是英文;还有社区的运营人员认为自家产品使用门槛较高,需要琢磨海外头部公司程序员的喜好,进行针对性推广等等。

无数的细节证明,最好的Global,是成为真正的Local。这是不少新兴国产数据库厂商孜孜以求的出海效果。

在第二条路线中,主打国产替代的数据库厂商们需要满足背景“正规”、服务意识强,以及产品自主可控、可用的要求。出于当前国产替代的进度,我们认为在党政、金融等领域,尤其是金融信创的进展将给这类厂商提供更广阔的空间。

原因不难推断。

首先,党政领域是国产替代的排头兵。这些行业中,客户的国产替代已经进行了一段时间,存量相较之前略微下降。相较而言,党政中的“下沉市场”会是接下来国产替代的重点。而2020年金融信创一期试点推行,2021、2022年的相关工作也在按计划推进,市场空间更为广阔。

第二,金融客户向来重视IT投入。在疫情未散的前提下,它们是为数不多IT预算充裕的客户。从数据看,2020年启动的金融信创一期试点,要求信创基础软硬件采购额占到其IT外采的5%-8%;2021年金融信创二期新增100余家试点单位,信创基础软硬件在IT外采中占比要求提高至10-15%。当然,这些预算既囊括基础硬件,也包含操作系统、中间件等其他基础软件,数据库所占比例暂不得而知。但根据一些券商调研,信创的出现在过去两年内整体提升了一些客户的IT投入。当金融信创进一步放开,相信包括数据库在内的基础软硬件厂商都会因此受惠。

第三,出于业务特点和由此带来的强监管要求,金融客户对用作核心业务产品的可靠、可用性考量超过了其他种种。这虽然带来了不少挑战,但同时也让不少技术能力较强,且具备完整知识产权的厂商更有机会参与其中。

过去一段时间内,36氪观察到不少数据库厂商正在持续布局金融信创。但谈及真正落地,其中的难度也不可忽视。

首先从产品层面,不同数据库架构不同,国产数据库厂商需要重视自身的产品兼容性,减少迁移过程可能给客户带来的问题。另外,现在不少客户是从非核心业务做起,再逐步开展对核心业务的数据库替代工作。36氪了解到,从过去的一些替代实践经验看,厂商需要从业务提出之初就和客户一起共创,不断根据其需求打磨产品,最终完成上线。这一过程可能耗费三年以上的时间。

再者,信创是一个系统工程,从下层的基础软硬件到上游的应用系统均属其中。数据库厂商作为其中的一个角色,也需要和各类厂商合作,为客户提供解决方案式的体验。这其中,产品间的兼容是一个重头戏。我们了解到,有厂商每年花费在不同厂商、不同产品适配工作上的资金达到千万元级别。

当然还需要明确的一点是,目前狭义的国产替代主要指关系型数据库层面。但在其他类型中,如图数据库领域,国内产品也有一定替代国外产品的空间。而且,出于各种考虑,不少外企也有退出国内市场的动作。这部分空余的市场空间也是国产厂商的新机会。

总而言之,国产替代对国内不少企业而言意味着新空间,但这势必也是一场攻坚战。主攻于此的数据库厂商需要具备战略定力,在产品、服务等方面针对性地进行长期投入。

不论是技术规律还是商业规律,都要落地到具体公司的实践中。在这一章节,36氪将按照不同分类,细致展示我们观察到的数据库领域参与者。

需要提前声明的是,以下公司及产品主要按照首字母排序,没有引申意义上的先后之分;另外,下文展示也不代表行业全貌,欢迎读者持续补充行业玩家;再者,由于数据库分类维度众多,一个数据库可能具备多种特点,本文展示仅提供参考价值。

数据库分类维度

根据分析能力,数据库可以分为 OLTP 与 OLAP 两大类。一方面,数据库要支持数据记录的增加修改,如网络商城的交易(transaction),这类操作被称为 OLTP(在线事务处理, Online Transaction Processing),另一方面,数据库也需要支持复杂的查询操作,比如说某个地区一个月之内销售额超过 10 万元的商家所在的城市,这类操作被称为 OLAP(在线分析处理,Online Analytical Processing)。此外,近些年有些新的数据库可以同时支持 OLTP 与 OLAP 操作,因此被称为 HTAP 型(混合事务分析处理,Hybrid transactional/analytical processing),另外,由于HTAP是两种功能交织的产品,在本文中将会与OLTP和OLAP一同介绍。具体某个HTAP产品放在OLTP板块还是OLAP板块,主要依据公开资料中的描述进行判断。但整体而言,HTAP兼具两种功能,这里的分类仅供读者参考。

数据库最初的应用场景之一是账本。大家外出购物时,家门口的小卖部的老板可能会用纸和笔来通过写写画画的方式,记录下每天的销售额和对应的货物清单,而大型超市则是通过扫码枪来自动记录生成售货记录,比如说在今天的下午三点,卖出一瓶矿泉水,价格是 1 块钱。在这里,“下午三点、矿泉水、1 块钱”这三条信息,便会作为一条记录(record),被存储到数据库中,以备将来查询。

对于个体商家来说,一般来讲一台计算机就能存储并处理所需数据,所需要的软件也就是单机数据库。现在比较常见的单机数据库有 MySQL 与 PostgreSQL。前者最早发布于 1995 年,由一家瑞典公司研发,后者则是在 1996 年由美国加州大学伯克利分校立项。这两者都秉承着开源,免费的原则,同时拥有成熟的社区与丰富的文档,因此广受中小企业的欢迎。

单机型数据库可以解决小商户的数据管理痛点。当生意越做越大时,客户需要的数据量也许会超出现有机器的存储能力。对于这种业务扩张的需求,业界一般有两种手段,一种是纵向扩展(scale up),也就是通过购买更先进的硬件,在现有机器数量不变的情况下,对现有的机器进行升级。这种手段的好处是机器的数量比较小,管理起来更加方便,也不需要采取更复杂的软件架构。银行业更倾向于采用这样的手段,银行业使用的机器,比如工商银行采用的 IBM 大型机,性能之强劲,价格之高昂,也不是中小公司能承受的,坊间相传这样的一台大型机售价几千万人民币甚至更高。

另一种更亲民的手段则是横向扩展(scale out),通过增加更多机器的手段来提供更强的存储与查询能力。这时候我们就需要用到分布式数据库了。分布式数据库在设计之初,就面对的是多台机器的场景,同一套数据库软件,被部署到多台机器上,这些机器彼此通过网络进行连接,从而形成一个数据库集群(cluster)。在这个宏大的集群中,通过一定的分割(partition)算法,每台机器都会分配到自己能够处理的一小块数据。同时,多台机器之间可以互相的实时备份(replication),这样就算是有一台甚至多台机器出现故障的时候,这个分布式数据库集群依然可以正常工作。得益于亲民的价格以及良好的扩展性,分布式数据库被视为业界最近的发展方向。

以前的数据库,需要软件公司或者互联网公司自己采购机器,并且在这几台或几十台机器上部署单机或者分布式的数据库,这种方式也被称为本地部署(on-premise)。时至今日,云计算使得大家可以通过在云上租机器,甚至租服务的方式,来使用数据库,这被称为云端部署(off-premise, cloud computing)。一方面,现有的分布式数据库可以从本地移到云端,来更方便大家使用,并把数据库的安装,部署和维护工作都交给云平台上的专业人士完成,另一方面,云原生(cloud-native)数据库也带来了一些新的思路:

更易扩展(better scalability): 当需要更多机器的时候,在云端可以在几分钟的时间里完成租用新机器并添加进数据库集群的操作,而如果数据库是部署在本地的话,大家不太可能在短时间内购买新的物理机来增加集群中机器的数量。如今的一些云数据库服务,会在后台进行机器的增减,在用户业务量突然增大的时候,自动进行性能的扩展,不需要用户操心具体的机器数量。

多租户出租(multi-tenant): 传统数据库更多的是只服务一位客户,在云端则没有这个限制,一台数据库机器可以满足多位客户的不同的读写需求。在做好不同客户之前的数据隔离的前提下,通过服务更多客户,云数据库可以进一步压缩成本,降低收费标准。

异地备份: 大型的互联网公司会有数据异地备份的需求,一方面是应对某一地区的数据中心完全失效的情况,比如说发生火灾或地震这种大规模的不可抗力,另一方面,也是为了减少不同地区之间的数据延迟(latency),像是美国的东西海岸,中国的北京和深圳,都隔着遥远的距离,如果所需的数据在本地区的数据中心中有备份,那就不需要再从其它地区读取数据。中小型公司一般不会有异地机房,因此借用云厂商的基础设施,可以更好的保证自身数据安全。

云原生数据库有两类重量级玩家,一种是云厂商本身,如 Amazon 的 AWS、微软的 Azure,这种云厂商自身的数据库可以很好地和自身的其它服务结合起来,比如 AWS 的机器(VM)可以更快的读取 AWS 的数据库,而读取其它地方的数据库就要慢一些。同时,云厂商为自家数据库提供了同样高质量的客服。另一类玩家则是独立的第三方数据库公司,如 MongoDB 的云数据库,用户可以选择依托 AWS,Azure 或者 Google Cloud,不管用户依托哪个云平台,用户都能享受 MongoDB 同样的服务。这样做的好处是,用户不受限于某家特定的云厂商,因而在定价方面有了更多的自主权。另外,当某一家云厂商发生问题的时候,用户可以快速迁移到同地区的另一家云厂商,使自己的客户不受影响。

在这一部分,我们重点罗列的公司和产品有:

简介:AliSQL 是基于 MySQL 官方版本的一个分支,由阿里云数据库团队维护,目前也应用于阿里巴巴集团业务以及阿里云数据库服务。该版本在社区版的基础上做了大量的性能与功能的优化改进。尤其适合电商、云计算以及金融等行业环境。

简介:PolarDB 是阿里巴巴自主研发的下一代关系型分布式云原生数据库,目前兼容三种数据库引擎:MySQL、PostgreSQL、高度兼容 Oracle 语法。计算能力最高可扩展至 1000 核以上,存储容量最高可达 100T。经过阿里巴巴双十一活动的最佳实践,让用户既享受到开源的灵活性与价格,又享受到商业数据库的高性能和安全性。

简介:BaikalDB 是百度推出的一个分布式增强型结构化数据库系统。它支持 PB 级结构数据的顺序和随机实时读/写。BaikalDB 兼容 MySQL 协议,支持 MySQL 风格的 SQL 方言,用户可以通过它无缝将数据存储从 MySQL 迁移到 BaikalDB。

简介:Rapids TXDB 是一款企业级交易型数据库系统,是柏睿数据基于 OpenGauss 开发推出并提供技术支持服务的商业发行版本,可为各行业客户的交易型(OLTP)应用场景提供安全、稳定、快速的联机事务处理支持。

简介:DM8是达梦公司在总结DM系列产品研发与应用经验的基础上,推出的新一代自研数据库。DM8融合了分布式、弹性计算与云计算的优势,对灵活性、易用性、可靠性、高安全性等方面进行了改进,支持超大规模并发事务处理和事务-分析混合型业务处理。

简介:“思极有容”数据库是一款国产自主可控的分布式关系型数据库,支持国产 CPU、操作系统生态,支持云平台和容器。在安全方面,设定多种权限访问、审计、流量控制机制,实现真正资源隔离。产品采用当前分布式技术,提供多种隔离级别,保障完整分布式事务。

简介:HighGo DB是一款企业级OLTP数据库。其专注于企业级市场,在承担海量数据、高并发的复杂业务应用方面表现较为突出,能够满足企业级应用对数据管理的需求。

简介:航天天域数据库管理系统 CASICloud DBCP 是由北京航天紫光科技自主研发的基于无共享架构的企业级分布式关系型数据库,具备高性能、高可用、跨平台、线性扩展等特性,并且具备强事务处理能力,同时支持分析。

简介:LightDB 是恒生电子股份有限公司研发并将长期支持的一款同时支持在线事务处理与在线分析处理的融合型分布式数据库产品。它是一款基于 PostgreSQL 的关系型数据库,99%兼容 PostgreSQL,主要针对金融业务场景优化。

简介:Cedar是由华东师范大学数据科学与工程学院基于OceanBase 0.4.2研发的高通量、可伸缩、高可用的分布式关系数据库。

简介:openGauss是一款开源关系型数据库管理系统,采用木兰宽松许可证v2发行。openGauss内核深度融合华为在数据库领域多年的经验,内核源自PostgreSQL,并着重在架构、事务、存储引擎、优化器等方向持续构建竞争力特性,在ARM架构的芯片上深度优化,并兼容X86架构。

简介:StarDB 是京东自主设计研发的一款金融级国产分布式数据库,支持海量数据高并发在线事务处理,具备无感分布式、金融级高可用、高度兼容 MySQL、弹性伸缩、安全合规、智能运维管控等重要功能特性。

简介:SequoiaDB 巨杉数据库是一款金融级分布式数据库,目前在超过 50 家大型银行核心生产业务规模应用,主要面对高并发联机交易型场景提供高性能、可靠稳定以及无限水平扩展的数据库服务。

简介:Goldilocks DBMS 是由科蓝软件研发的拥有独立知识产权的 RDBMS,适合需要 24 小时稳定运行和高性能的交易型单机版及分布式系统使用。

简介:OceanBase 是由蚂蚁集团完全自主研发的企业级分布式关系数据库,基于分布式架构和通用服务器、实现了金融级可靠性及数据一致性,拥有 100%的知识产权,始创于 2010 年。OceanBase 具有数据强一致、高可用、高性能、在线扩展、高度兼容 SQL 标准和主流关系数据库、低成本等特点。

简介:GBase 8s是天津南大通用数据技术股份有限公司自主研发的企业级分布式事务型数据库。支持分布式部署、集中式部署、共享存储高可用部署、支持两地三中心高可用部署。GBase 8s适用于OLTP 应用场景。

简介:分布式交易型数据库GBase 8c是一款shared nothing架构的分布式交易型数据库,具备高性能、高可用、低成本、资源调度精细化、集群运维智能化等特性,可以为金融核心系统、互联网业务系统和政企业务系统提供安全、稳定、可靠的数据存储和管理服务。

简介:TiDB 是 PingCAP 公司自主设计、研发的开源分布式关系型数据库,是一款同时支持在线事务处理与在线分析处理的融合型分布式数据库产品。目标是为用户提供一站式 OLTP、OLAP 、HTAP 解决方案。TiDB 适合高可用、强一致要求较高、数据规模较大等各种应用场景。

简介:HotDB Server 是一款实现数据容量和性能横向扩展的交易关系型分布式事务数据库产品。它兼容主流数据库协议和 SQL92/SQL99/SQL2003 标准语法,支持自动水平拆分和垂直拆分,能在数据存储分布式化环境下为应用提供集中式数据库的操作体验。

简介:KingbaseES是一款面向事务处理应用,兼顾简单分析应用的企业级关系型数据库,产品融合了金仓在数据库领域多年的产品研发经验和企业级应用经验,可满足各行业用户多种场景的数据处理需求。

简介:神通数据库管理系统是天津神舟通用数据技术有限公司自主研发的大型通用数据库产品,拥有全文检索、层次查询、结果集缓存、并行数据迁移、双机热备、水平分区、并行查询和数据库集群等增强型功能,并具有海量数据管理和大规模并发处理能力。

简介:TDSQL MySQL版(TDSQL for MySQL)是部署在腾讯云上的一种支持自动水平拆分、Shared Nothing 架构的分布式数据库。TDSQL MySQL版 默认部署主备架构,提供容灾、备份、恢复、监控、迁移等全套解决方案,适用于 TB 或 PB 级的海量数据库场景。

简介:TDSQL PostgreSQL版(TDSQL for PostgreSQL, 原 TBase)是腾讯自主研发的分布式数据库系统,具备高 SQL 兼容度、完整分布式事务、高安全、高扩展、多级容灾等能力,成功应用在金融、政府、电信等行业核心业务中。

简介:GreatDB 分布式是一款原生分布式关系型数据库软件,具有动态扩展、数据强一致、集群高可用等特性。采用 shared-nothing 架构,基于数据冗余与副本管理确保数据库稳定可靠,基于数据 sharding 与 mpp 技术实现高性能,并具备动态扩展数据节点能力。目前已广泛应用于金融、运营商、能源、政府、互联网等行业核心系统,兼容国产操作系统、芯片等国产软硬件生态。

简介:H3C SeaSQL DRDS是一款实现数据容量和性能横向扩展的交易关系型分布式事务数据库产品。它兼容主流数据库协议和 SQL92/SQL99标准语法,支持自动水平拆分和垂直拆分,能在数据存储分布式化环境下为应用提供集中式数据库的操作体验。

简介:KunDB 是星环分布式交易型数据库。公司介绍,其实高度兼容 MySQL、Oracle的国产分布式交易型数据库,为企业核心业务数据库建设提供完备的能力支撑和可靠的国产化迁移方案。

简介:AntDB是一款通用企业级,高可用、高性能的原生分布式关系型数据库,凭多年技术累积面向电信、政务、能源、金融、交通等行业精心打造。该产品采用了原生分布式架构,实现了在线弹性伸缩和分布式强一致,全面兼容MySQL、PostgreSQL 并支持SQL 2016标准。

简介:面向大中型银行的新一代云原生分布式核心交易数据库。

简介:MogDB 是云和恩墨基于 openGauss 开源数据库进行定制、推出的企业发行版。

简介:昆仑数据库是泽拓科技研发的NewSQL分布式关系数据库,面向TB和PB级别海量数据处理,以高吞吐量和低延时处理海量高并发读写请求。它提供事务ACID保障,高可扩展性,高可用性和透明的分库分表数据处理功能。

简介:针对银行 OLTP 业务,中兴通讯分布式数据库 GoldenDB 为业务带来传统单机数据库无法提供的计算及扩展能力,提供高可用、高可靠、资源调度灵活的数据库服务,支持金融行业已有业务升级及创新业务快速部署的需求。

简介: Amazon Aurora 是一种与 MySQL 和 PostgreSQL 兼容的关系数据库,专为云而打造,既具有传统企业数据库的性能和可用性,又具有开源数据库的简单性和成本效益。Amazon Aurora 的速度最高可以达到标准 MySQL 数据库的五倍、标准 PostgreSQL 数据库的三倍。它可以实现商用数据库的安全性、可用性和可靠性,而成本只有商用数据库的 1/10。Amazon Aurora 由 Amazon Relational Database Service (RDS) 完全托管,RDS 可以自动执行各种耗时的管理任务,例如硬件预置以及数据库设置、修补和备份。Amazon Aurora 采用一种有容错能力并且可以自我修复的分布式存储系统,这一系统可以把每个数据库实例扩展到最高 128TB。它具备高性能和高可用性,支持最多 15 个低延迟读取副本、时间点恢复、持续备份到 Amazon S3,还支持跨三个可用区复制。

简介:Amazon Keyspaces(for Apache Cassandra)是一种可扩展、高度可用、托管式 Apache Cassandra 兼容数据库服务。借助 Amazon Keyspaces,用户可以继续使用当前的相同 Cassandra 应用程序代码和开发人员工具在 AWS 上运行 Cassandra 工作负载,而无需预置、修补或管理服务器,并且不需要安装、维护或操作软件。Amazon Keyspaces 是无服务器服务,因此您只需为实际使用的资源付费,并且该服务会根据应用程序流量自动扩展和缩减表。

简介:Apache Cassandra(一般被简称为 C*)是由 Facebook 开发并开源的分布式数据库系统,具有良好的扩展性,可以动态的在运行过程中进行机器数量的加减,但并不支持太过复杂的 SQL 操作。Cassandra 采用宽列存储模型,每一行数据都由唯一的 key 标识,并可以有多列,类似于二维的键值存储。Cassandra 本身开源,并由开源社区进行维护,因此众多云厂商基于开源版本,都提供了各自的 Cassandra 云服务。

简介: CockroachDB的目标是打造一个开源、可伸缩、跨地域复制且兼容事务的 ACID 特性的分布式数据库。据介绍,它不仅能实现全局(多数据中心)的一致性,而且保证了数据库的生存能力,就像 Cockroach(蟑螂)这个名字一样,是打不死的小强。CockroachDB 的思路源自 Google 的全球性分布式数据库 Spanner。其理念是将数据分布在多数据中心的多台服务器上,实现一个可扩展,多版本,全球分布式并支持同步复制的数据库。2021年12月,Cockroach Labs进行了F轮融资,共融资2.78亿美元,估值50亿美元。

简介: Couchbase 是一个高性能、分布式、面向文档的NoSQL数据库。Couchbase 提供了一些和其他一些领先的NoSQL数据库相似的功能或者增强功能。Couchbase是MemBase与couchDB这两个NoSQL数据库的合并的产物,拥有CouchDB的简单和可靠以及Memcached的高性能。Couchbase于2021年7月在美国纳斯达克交易所进行IPO,目前市值8亿美元左右。

简介:FaunaDB是一个灵活,用户友好的,支持事务的数据库。Fauna支持原生GraphSQL,同时,Fauna的数据库服务是以安全可扩展的云API的形式来提供,以此来让用户无需操心数据库的机器数量,扩展,分片,备份等诸多问题。2020年7月Fauna进行了A轮融资,共计2700万美元。

简介: Cloud Spanner是一项完全托管式用于关键任务的关系型数据库服务,可提供全球范围的事务一致性、自动同步复制功能以实现高可用性,以及对两种 SQL 方言的支持:Google 标准 SQL(ANSI 2011 及扩展程序)和PostgreSQL。

简介:Bigtable是Google研发并商用的全代管式可扩缩的 NoSQL 数据库服务,用于处理大规模分析和运营工作负载,可用性达 99.999%。其具有以下的特点:延迟时间始终在 10 毫秒以内,每秒可处理数百万个请求; 非常适合个性化、广告技术、金融技术、数字媒体和 IoT 等使用场景; 可根据用户的存储需求无缝扩缩;重新配置时无需停机; 采用适合机器学习应用的存储引擎设计,可提升预测效果; 可轻松连接到 Google Cloud 服务(例如 BigQuery)或 Apache 生态系统。

介绍:IBM DB2 是美国 IBM 公司开发的一套关系型数据库管理系统,它主要的运行环境为 UNIX(包括 IBM 自家的 AIX)、Linux、IBM i(旧称 OS/400)、z/OS,以及 Windows 服务器版本。DB2 主要应用于大型应用系统,具有较好的可伸缩性,可支持从大型机到单用户环境,应用于所有常见的服务器操作系统平台下。DB2 采用了数据分级技术,能够使大型机数据很方便地下载到 LAN 数据库服务器,使得客户机/服务器用户和基于 LAN 的应用程序可以访问大型机数据,并使数据库本地化及远程连接透明化。DB2 以拥有一个非常完备的查询优化器而著称,其外部连接改善了查询性能,并支持多任务并行查询。DB2 具有很好的网络支持能力,每个子系统可以连接十几万个分布式用户,可同时激活上千个活动线程,对大型分布式应用系统尤为适用。

简介:MariaDB 是 MySQL 数据库在 Oracle 公司之外的独立分枝,由原 MySQL 团队的部分创始成员开发,并高度兼容 MySQL。这些 MySQL 团队成员担心 MySQL 被 Oracle 公司收购之后,会带来一系列的法律和产权问题,因此创立了一条新的开源分支。如今MariaDB也在进行迭代,比如SkySQL是MariaDB Enterprise数据库的云服务版本,提供database-as-a-service (DBaaS)功能。其整合了丰富而强大的数据库功能,简单易用,并且高度自动化。

简介: Azure Cosmos DB 是一种用于现代应用开发的完全托管式NoSQL数据库服务。具有有保证的个位数毫秒级响应时间和由SLA支持的99.999%可用性、自动、即时的可伸缩性,以及用于MongoDB和Cassandra的开放源代码API。借助统包数据复制和多区域写入,在世界任何地方都能进行快速读写操作。

简介:SQL Server 是 Microsoft 公司推出的关系型数据库管理系统。具有使用方便可伸缩性好与相关软件集成程度高等优点,可跨越从运行 Microsoft Windows 98 到运行 Microsoft Windows 2012 的大型多处理器的服务器等多种平台使用。

简介:MongoDB 是一种面向文档的数据库系统,主要管理类似于 JSON 格式的文档型数据。由总部位于美国纽约的MongoDB Inc.公司研发,并于 2009 年首次发布开源版本。MongoDB 采用主从式架构,以此来保证数据的高可用性与可靠性。用户可以自行部署 MongoDB 集群,也可以付费使用 MongoDB 的云数据库服务。

简介:MySQL 是一个关系型数据库管理系统,现属于 Oracle 旗下产品,是最流行的关系型数据库管理系统之一。MySQL 软件采用了双授权政策,分为社区版和商业版,由于其体积小、速度快、总体拥有成本低,尤其是开放源码这一特点,一般中小型网站的开发都选择 MySQL作为网站数据库。

简介::Oracle Database,又名 Oracle RDBMS,或简称 Oracle。是 甲骨文公司的一款关系数据库管理系统 。它在数据库领域一直

标签: 国产自主连接器国产可代连接器1500vc重量变送器挖机快速连接器出租精小型压力变送器一体式传感器020c型风向传感器

锐单商城拥有海量元器件数据手册IC替代型号,打造 电子元器件IC百科大全!

锐单商城 - 一站式电子元器件采购平台