2021年5月15日,领先的金融级分布式数据库厂商SequoiaDB巨杉数据库举行了2021年春季发布会。在本次发布会中,巨杉数据库基于「湖仓一体」架构,针对不同的业务需求场景细分出全新的产品线。同时进行了最新的SequoiaDB Cloud数据库云平台操作演示,并将于近期邀请企业客户进行SequoiaDB Cloud测试。
数字化转型在过去10年间持续带动IT技术发展,今天企业面对的数据环境已经从单一的结构化表单数据,扩展到包括结构化、半结构化和非结构化的多类型业务场景。近年来,面向全新数字化业务的混合数据场景,企业数据量已经形成爆炸性的增长趋势,推动着数据库技术的发展。在2011年首次提出“数据湖 DataLake”的概念后,业界于2020年结合云原生的架构又再次提出“湖仓一体 Data Lakehouse”的定义,让大数据时代迎来了全球变革的一年。

巨杉数据库聚焦于海量数据的全新场景,2011年产品投入研发之初,就专注于多模能力的“数据湖”产品,并于2013年正式发布首个商用版本。2015年后,巨杉数据库更逐步加入数据分析引擎及跨引擎事务一致性能力,为客户提供具备海量联机数据交易及分析能力的「湖仓一体」数据基础设施。在金融银行业生产环境中,巨杉数据库运行时间最长的集群已经超过7年,最大单客户集群规模达300台物理服务器,所管理的单集群最大数据量达到1万2000亿条。无论在物理服务器部署、私有云或公有云环境下,巨杉数据库均能够通过同一套软件架构,实现跨平台、跨底座的快速部署与应用。
巨杉数据库联合创始人兼CTO王涛表示,「湖仓一体」是一类技术架构的统称,而不是某个产品。巨杉数据库对这类技术架构的布局最早可追溯到2015年,在业界形成统一认知的概念之前,就提前5年利用其特点协助客户落地湖仓一体数据架构。当前巨杉数据库已经在民生银行、广发银行、恒丰银行、渤海银行等股份制银行;广东省农信、吉林省农信、四川省农信等省级农信行;上海银行、长沙银行、广州银行等城商农商行;以及PICC人保、中国结算等超过100家头部金融银行业客户规模化生产上线。

「湖仓一体」海量联机交易及分析的数据基础设施
在数字化转型的全新技术趋势中,数据平台需要同时承载联机业务与分析能力,因此Data Lakehouse架构并非单纯为了OLAP分析而设计。Data Lakehouse可以支持联机交易、流处理和分析,并且同时支持结构化、半结构化和非结构化数据的存储。因此,Data Lakehouse作为数据基础设施,其真正的价值在于打通不同业务类型、不同数据类型之间的技术壁垒,实现交易分析一体化、流批一体化、多模数据一体化,最终降低数据流动带来的开发成本及计算存储开销,提升企业的运作的“人效”和“能效”。

本次发布会中,面向客户对「湖仓一体」各个不同场景的需求,巨杉数据库细分出4大产品线。
各个产品线均基于统一的SequoiaDB分布式数据库内核,可以按需独立部署,也可叠加使用。基于「湖仓一体」架构,降低数据流动带来的开发成本及计算存储开销,提升企业海量数据处理的“人效”和“能效”。
SequoiaDB Cloud打破部署边界,跨多云灵活部署
近年来越来越多企业开启了“上云之路”,云计算的重要性在业界已经毋庸置疑。企业的云计算落地,往往会按自身的需求,选择使用不同能力的云厂商。一些企业甚至会选择多家云厂商的IaaS平台作为基础设施,这就好比以往我们选择多家服务器厂商构建基础设施一样。作为新一代分布式数据库,SequoiaDB Cloud面向不同的云厂商,提供跨公有云及私有云「跨多云」的部署能力。

巨杉数据库早在2018年即开启了跨多云统一部署的研发,目前已经形成一套可以同时满足裸机、私有云以及公有云环境部署的平台架构。巨杉数据库已经在多家银行客户实现了基于多厂商云平台的大规模生产环境落地,同时将在今年正式推出订阅模式,进一步实现跨腾讯云、华为云、亚马逊等公有云环境的数据库云服务。
深耕数据沃土,提升数据价值
随着企业数字化转型的深入,企业对海量大数据的实时联机处理(包括联机交易和联机分析)需求越来越迫切。一方面,面对这些全新的应用需求,企业级的商业化产品可从企业的核心诉求出发,稳健地满足企业的应用需求。另一方面,面对业务场景带来的挑战,企业该如何应对底层的数据架构进行变革,湖仓一体无疑提供了明确的变革方向。
巨杉数据库表示,未来巨杉将持续秉承“坚持以客户为中心”的核心价值观,聚焦于「湖仓一体」架构的分布式技术创新,与上下游合作伙伴生态共同深耕数据沃土,提升数据价值,为客户提供安全、稳定、可靠的金融级数据基础设施。
好文章,需要你的鼓励
尽管全球企业AI投资在2024年达到2523亿美元,但MIT研究显示95%的企业仍未从生成式AI投资中获得回报。专家预测2026年将成为转折点,企业将从试点阶段转向实际部署。关键在于CEO精准识别高影响领域,推进AI代理技术应用,并加强员工AI能力培训。Forrester预测30%大型企业将实施强制AI培训,而Gartner预计到2028年15%日常工作决策将由AI自主完成。
这项由北京大学等机构联合完成的研究,开发了名为GraphLocator的智能软件问题诊断系统,通过构建代码依赖图和因果问题图,能够像医生诊断疾病一样精确定位软件问题的根源。在三个大型数据集的测试中,该系统比现有方法平均提高了19.49%的召回率和11.89%的精确率,特别在处理复杂的跨模块问题时表现优异,为软件维护效率的提升开辟了新路径。
2026年软件行业将迎来定价模式的根本性变革,从传统按席位收费转向基于结果的付费模式。AI正在重塑整个软件经济学,企业IT预算的12-15%已投入AI领域。这一转变要求建立明确的成功衡量指标,如Zendesk以"自动化解决方案"为标准。未来将出现更精简的工程团队,80%的工程师需要为AI驱动的角色提升技能,同时需要重新设计软件开发和部署流程以适应AI优先的工作流程。
这项由德国达姆施塔特工业大学领导的国际研究团队首次发现,当前最先进的专家混合模型AI系统存在严重安全漏洞。通过开发GateBreaker攻击框架,研究人员证明仅需关闭约3%的特定神经元,就能让AI的攻击成功率从7.4%暴增至64.9%。该研究揭示了专家混合模型安全机制过度集中的根本缺陷,为AI安全领域敲响了警钟。