近年来,全球范围内创新型数据库企业和产品不断涌现,我国数据库产业和生态日益繁荣,正在进入高质量发展期。《数据库发展研究报告(2023 年)》显示,2022 年我国公有云数据库市场规模首次过半,预计 2023 年公有云市场占比将进一步扩大达到 59.8%。腾讯云数据库总经理王义成表示,这个预测结果非常合理:“云数据库分为公有云和私有云两种形式。私有云是建立在云厂商基础上的,例如中国建设银行、中国银联、数字广东和浙江政务等企业都是使用腾讯云、阿里巴巴和华为等云厂商提供的私有云进行业务孵化。公有云市场仍然在持续增长,但纯数据库软件市场将会逐渐稳定甚至逐步下降。”
当下,国内企业对云数据库的关注度有所增加,譬如快手和美团等大型企业逐渐放弃自建的 IDC 部署转向公有云。在金融和政务领域,一些创新型的企业会选择公有云或行业云来满足其业务需求,而对于核心业务要求稳定性和安全性的企业则相对较难改变现有的机房部署方式。总体而言,云数据库的发展将继续增长,特别是公有云市场,随着云的便捷性和弹性优势的日益突出,越来越多的行业和企业将选择将其数据迁移到云上。
在这种趋势下,2023 年 7 月 4-5 日,由中国信息通信研究院、中国通信标准化协会指导,中国通信标准化协会大数据技术标准推进委员会(CCSA TC601)与 InfoQ 联合主办了“2023 可信数据库发展大会”,腾讯云数据库总经理王义成在本届大会上发表了《腾讯云数据库 TDSQL 助力金融业核心系统国产化转型》的主题演讲分享,并在会后接受了 InfoQ 的专访。
“十四五”规划提出“加快数字化发展”的总体布局, 数据库作为金融信息系统的关键基础设施,其行业景气度持续提高,数据库国产化趋势愈发明显,上百家金融业试点单位在数据库国产化的进程中,进一步增强信心,向 50% 国产化率大步迈进。
如今大批量的应用其实都是基于 Oracle 构建的,在国产化替代过程中,厂商就要提供很多在驱动、内核、资源、架构等层面与 Oracle 兼容的能力,构建全面的 Oracle 兼容解决方案,从而实现迁移、平滑的双轨运行以及互相切换等。
关于如何更好地从Oracle手里“接棒”,王义成在接受 InfoQ 的采访中表示,“国产数据库与 Oracle 在数据库核心能力上差距其实不大,目前国产数据库可能更多专注于自身,但是客户看待数据库是一体化的视角。以排查处理故障为例,数据库厂商应该跳出自己,去沉淀全套故障排查和高可靠的白屏化能力,这样双方的人力和效率都能有大幅提升。数据库绝非是数据库本身,需要考虑如何从功能、架构、优化、运维等全方位角度帮助用户使用好数据库,这样厂商才能走得远。”
当今,在以数据要素驱动、数据价值实现为核心的数字化转型大潮中,企业如逆水行舟,不进则退,如果不跟上数字化转型的步伐,终将会被用户抛弃、被竞争对手超越、被市场边缘化,以致最终出局。
落实传统数据库转型、布局智能化建设可以说是近年来金融行业的两大工作重点,腾讯云数据库一直在赋能金融行业的核心数据库替换方面“开疆辟土”,其数据库产品 TDSQL 在推动数据库技术实现安全可控的道路上取得了开拓式创新,已累计为 3000+ 的政企和金融机构提供数据库的公有云及私有云服务,客户覆盖银行、保险、证券、互联网金融、计费、第三方支付、物联网、互联网 +、政务等诸多领域,为国产化数据库的发展和应用积累了宝贵经验。
王义成在演讲中表示,从技术角度,金融行业核心下移数据库选型大致有两条路线。其一是,历经 30 多年全球海量场景淬炼的开源方案,其数据库核心引擎基于 B+ 树的数据结构,对磁盘亲和,并深度优化 MySQL、PostgreSQL 内核,具备研发分布式化、金融级高可用、一致性、智能运维等能力;其二多是采用新技术进行研发的 NewSQL 路线,其数据库核心引擎基于 LSM-Tree 数据结构,对内存亲和,计算层和存储层完全分离。
要知道,金融行业里的每个机构发展状况都各不相同,在数据库的选型方面也存在差异,需要针对具体应用场景对数据库能力的需求和侧重,选择适合自身的数据库产品:比如互联网银行、互联网保险在线类业务由于在扩容方面的要求比较高,会更偏向于敏态扩容方案或弹性方案;又如,一些银行传统业务会选择基于相对稳定的内核构建的分布式解决方案来做业务支撑;再如,网上交易核心、渠道核心业务会更倾向于 NewSQL 方式。
针对金融行业这种传统行业在数据库选型中的变化与差异,腾讯云数据库提供了相应的三种解决方案:
针对核心业务系统替换,提供极具竞争力的产品和定价来支撑金融、政务、保险、资管、零售这类核心业务系统的替换,在底层采用基于比较稳定的内核构建的分布式数据库架构来支撑。
依靠标准化产品的被兼容、拓展和多态部署能力,去拓展更多行业场景(如能源、交通、制造等),助力更多行业的数字化转型。
拥抱云原生,解耦存储和计算,无缝嵌入云原生开发工具,规模化满足新应用的底层数据需求。
TDSQL 作为腾讯云多年持续投入研发的数据库产品,它基于分布式架构,无论是资源还是功能都能提供良好的扩展性,通过软硬结合的方式支持读写分离、秒杀、红包、全球同服等超高性能场景,能够确保多副本架构下数据强一致性,避免故障后出现集群数据错乱和丢失;同时,通过数据库防火墙、透明加密、自动脱敏等保障企业级安全性,减少用户误操作或黑客入侵带来的安全风险;在金融级高可用方面,还具备跨区容灾、同城双活、故障自动修复等特点;此外,TDSQL 还通过智能 DBA、自助化运营管理后台等配套设施来提供便携的运维。
性能:针对不同的 SQL 语句,通过基于代价和规则的判断来提高执行效率,同时优化复制机制,确保数据链路在从逻辑到物理复制过程中不受网络拖累;
稳定性:TDSQL 的 HA 模块经过长时间的调优,能够应对各种场景下的稳定性切换;
数据安全和隐私保护:在事前阶段通过配置规则、安全组、白名单、SQL 防火墙来保障数据安全性,在事中阶段通过 SQL 拦截、SQL 黑名单等措施,防止大规模脱库和攻击行为;在事后阶段,支持对事件进行溯源追溯;
数据的脱敏和加密:支持链路层加密、存储层加密和针对特定列项的脱敏加密,在演练环境中还可对指定库进行脱敏操作从而保护隐私数据。
腾讯云 TDSQL 是国产数据库艰辛爬坡的一个缩影。大家看到的,是国产数据库在各行各业的大量投产以及市场份额的逐步提升,大家看不到的,是背后无数的打磨与优化。
三年前,腾讯云 TDSQL 的兼容性还不够完善,经历了在驱动、语法、性能层面的不断打磨和攻坚,目前已经可以独当一面。比如某头部保险公司使用 TDSQL 全面替换 Oracle,目前已在线上平稳运行 24 个月以上,部署了数万核心;又如,阳光保险 OA 系统凭借 TDSQL 的高度 Oracle 兼容能力,实现了业务短期迁移上线,生产环境更新表结构效率提升 50%;再如基于 TDSQL-C 的查询能力,能够打破 CPU 单核限制,实现整体的性能提升。
除了国内市场的数据库国产化替换,中国数字技术在出海方面也取得了不错的成绩:实现金融服务闭环,海量数据、高频交易、网银业务是印尼银行新项目面临的巨大挑战,TDSQL 以专业的可靠性、安全性和体验为印尼银行的数字银行核心系统赋能,将 TDSQL 纳入其核心系统后,2022 年印尼银行每天可以处理 200 万笔交易和 150,000 笔贷款支付,TDSQL 的高性能也为印尼银行在一年内获得 2000 万用户和 3500 万账户的业务爆发式增长提供了有力支持。
TDSQL 多次入围 Gartner 全球数据库魔力象限,其 OLTP 能力获得了国内第一的好成绩,是如今金融行业核心系统替换过程中的优选数据库。在前段时间的 TPC-C 打榜中,TDSQL 性能达到每分钟 8.14 亿笔交易(tpmC),打破了世界记录,同时也构建了业界最大的分布式集群,平均时延等领先其它厂商;在性价比方面,通过软件优化降低了硬件成本,通过公有云模式降低了服务成本,仅用行业三分之一的单位成本,就扛住了更大规模的并发,实现了超大规模集群性能稳定性,在 8 个小时持续压测过程中,tpmC 波动率一直处于 0.2% 以下,远低于标准的 2%,刷新了全球数据库极限,这充分证明了 TDSQL 承载金融核心场景的能力,这既给国产数据库的研发增强了信心,也给国产数据库的使用者增强了信心。
《数据库发展研究报告(2023 年)》显示,中国数据库厂商有 150 家,中国市场虽然很大,但让每家厂商都能存活下来却异常艰难,想要在群雄逐鹿的中国数据库市场跻身前列,交付成本和升级成本是两大亟需解决的事情。得益于云厂商升级过程全部依赖于原厂能力这一天生优势,相较于传统独立的数据供应商,云厂商的升级成本很低。而在交付成本方面,构建生态是非常关键的因素,有多少合作伙伴愿意在上游做适配在下游拥抱数据库做数据支撑非常关键。
据此,腾讯云认为绑定合作生态是非常重要的,未来腾讯云将打造以 TDSQL 为中心,上下游产业协调生态圈,抓住国产化软件替换的大潮,在操作系统、芯片及整机厂商、中间件厂商做兼容性适配,在集成商、认证服务商,共同打造 TDSQL 服务生态环境,促进数据库技术的快速演进。
腾讯云 TDSQL 通过其稳定性、功能丰富和易用性等优势,在国产化数据库的竞争中,为客户提供了可靠的数据库解决方案。比如第七次全国人口普查从线下搬到了线上,数据库需要承载全国十多亿人口数据,并要求在 15 天内完成数据的高速入库汇聚,支持海量数据的分析,无论是数据量还是并发度,靠传统集中式数据库无法解决这一难题。TDSQL 基于多年打磨的 HTAP 混合负载能力,在 2020 年底完整支撑了第七次人口普查海量数据高速入库和海量数据的多维统计分析。此外,TDSQL 还参与了首家运营商核心系统数据库分布式国产化改造项目,TDSQL 团队利用兼容工具进行数据迁移,并逐步提高产品语法的兼容性,最终在项目中贡献了 98% 的兼容性,对于剩下的 2%,TDSQL 团队与开发商合作进行了改动,收获了客户的认可。
目前我们已经观察到,当前企业对于国产数据库的选型能力正在逐步提升,不同行业的企业已经具备了一定的判断力和自主选择性。拿金融行业来说,无论是大型机构还是中小型企业,都具备了较为成熟的选型能力,其中一些大型机构更倾向于自主制定选型策略。而中小型机构则会参考其他同类机构的选型经验,以降低选型风险。王义成在采访中的回答也印证了这一观点:“在其他行业中,大企业通常会参照其他大企业的做法,选择被广泛认可的数据库,以优化数据处理和提升业务效率。例如,当某行业的一家领先企业选用了某款数据库产品后,其他企业也会倾向于选择相同的数据库,以保障数据处理的稳定性和安全性。”
但不管怎么说,云数据库国产化已经走上了高速发展的阶段。从企业应用层面来看,整个国产化替换都已经到了一个关键时期,厂商单打独斗的力量总是有限的,只有各数据库厂商团结上下游的力量,共同应对技术瓶颈,才能实现国产数据库的技术突破。
随着 5G、云计算、大数据等的跨越式发展,数据库技术不断演进。王义成在接受采访时表示,在当前的数据库发展中,有两个比较明确的方向——分布式数据库和云原生数据库,这两个方向已经得到广泛应用,并取得了成功的发展;另外,在非关系型数据库领域,出现了多种类型的数据库,如图数据库、向量数据库、键值型内存数据库和文档型数据库等,都正在“齐头并进”式发展。
其中,向量数据库是王义成比较看好的,也是当今较为热门的数据库技术之一,它在大模型应用和人工智能应用中具备一定的优势。尽管向量数据库存在发展机会,但目前它仍然处于初级阶段,而且还需要注意的是,向量数据库并不是一个可以独立主导所有数据的数据库,它更多是一个与关系型数据库和 AP 数据库相结合,提供贴近 AI 场景的实时存储功能解决方案。
目前向量数据库技术仍需各厂商进一步探索,以在具体的垂直领域或应用场景中获得更大的爆发大,但随着大模型技术的日益火热,相信向量数据库的发展也将进入快车道,成为各厂商竞技的新赛场。
对于腾讯云来说,其正在进行向量数据库的自研工作,并于近日发布了国内首个 AI Native 向量数据库 VectorDB,可支持 10 亿级向量检索规模,延迟控制在毫秒级。相比传统单机插件式数据库检索规模提升 10 倍,同时具备百万级 QPS 峰值能力。针对大模型场景,在接入层、计算层、存储层实现了全面 AI 化,使得企业接入大模型的效率提升 10 倍。腾讯云已经在内部使用向量数据库来支持音乐搜索和其他业务应用,并计划在今年 8 月开始面向公有云客户推出公测,大家可以期待一下。
文章引用微信公众号"InfoQ",如有侵权,请联系管理员删除!