今年上半年,Gartner發(fā)布2021年度數(shù)據(jù)管理領(lǐng)域的成熟度模型報(bào)告—Hype Cycle,湖倉(cāng)一體(Lakehouse)作為近兩年的新興技術(shù)熱點(diǎn),成為了首次進(jìn)入成熟度模型的五個(gè)新軍之一,備受業(yè)界關(guān)注。本篇文章,我們將介紹什么是湖倉(cāng)一體,湖倉(cāng)一體架構(gòu)的特點(diǎn)和技術(shù)優(yōu)勢(shì)。
湖倉(cāng)一體,其含義是指將數(shù)據(jù)湖的語(yǔ)義靈活性與數(shù)據(jù)倉(cāng)庫(kù)的生產(chǎn)優(yōu)化和交付相結(jié)合。它是一個(gè)融合的基礎(chǔ)設(shè)施環(huán)境,支持從原始數(shù)據(jù)到精煉數(shù)據(jù)的整個(gè)過(guò)程,并最終提供優(yōu)化后的數(shù)據(jù)以供消費(fèi)。
湖倉(cāng)一體將使業(yè)務(wù)從簡(jiǎn)化的交付流程、數(shù)據(jù)的快速訪問(wèn)中受益,同時(shí)滿足了用戶對(duì)于性能和易用性的更高要求,降低了大數(shù)據(jù)分析的技術(shù)復(fù)雜度和成本,同時(shí)滿足了用戶對(duì)性能和易用性的更高要求。通過(guò)構(gòu)建整合的數(shù)據(jù)管理平臺(tái),服務(wù)于各種各樣的職能角色,包括專(zhuān)業(yè)的數(shù)據(jù)科學(xué)家、數(shù)據(jù)工程師和業(yè)務(wù)分析師等,甚至包括通過(guò)數(shù)據(jù)看板來(lái)使用數(shù)據(jù)的臨時(shí)用戶。湖倉(cāng)一體本質(zhì)上為數(shù)據(jù)科學(xué)的創(chuàng)新提供了定義明確、可落地的發(fā)展途徑。
湖倉(cāng)一體作為企業(yè)未來(lái)數(shù)據(jù)平臺(tái)的重要基礎(chǔ)架構(gòu),需要一種強(qiáng)有力的分布式數(shù)據(jù)庫(kù)支撐其海量、多模、多態(tài)的數(shù)據(jù)。巨杉數(shù)據(jù)庫(kù)SequoiaDB基于100%自研的分布式數(shù)據(jù)庫(kù)內(nèi)核,提供了湖倉(cāng)一體萬(wàn)億級(jí)數(shù)據(jù)服務(wù)平臺(tái),適用于歷史數(shù)據(jù)平臺(tái)、全量數(shù)據(jù)平臺(tái)、實(shí)時(shí)數(shù)據(jù)中臺(tái)等需要將海量多模數(shù)據(jù)用于對(duì)客服務(wù)的場(chǎng)景。
巨杉數(shù)據(jù)庫(kù)基于湖倉(cāng)一體的架構(gòu)特性,構(gòu)建數(shù)據(jù)基礎(chǔ)設(shè)施平臺(tái),整合結(jié)構(gòu)化、半結(jié)構(gòu)化、非結(jié)構(gòu)化數(shù)據(jù)的統(tǒng)一存儲(chǔ)與管理,為面向全量數(shù)據(jù)業(yè)務(wù)提供:SQL、NoSQL、Object等多種接口。此外,通過(guò)特有的跨引擎事務(wù)能力,可以有效簡(jiǎn)化多團(tuán)隊(duì)開(kāi)發(fā)流程中對(duì)不同引擎、不同結(jié)構(gòu)的數(shù)據(jù)管理,打通ACID事務(wù)支持,提升業(yè)務(wù)開(kāi)發(fā)、數(shù)據(jù)處理、運(yùn)維管理能力,釋放全量數(shù)據(jù)價(jià)值,提升企業(yè)數(shù)據(jù)處理的“人效”及“能效”。
基于SequoiaDB分布式數(shù)據(jù)庫(kù)的湖倉(cāng)一體平臺(tái),除了具備多模能力,兼容多種數(shù)據(jù)引擎以外,還提供包括流式計(jì)算、高性能列存分析引擎等能力,適用于需構(gòu)建融合數(shù)據(jù)平臺(tái)及在保持事務(wù)一致性的基礎(chǔ)上,進(jìn)行高性能實(shí)時(shí)分析的場(chǎng)景。通過(guò)SequoiaDB可打破數(shù)據(jù)湖與數(shù)據(jù)倉(cāng)庫(kù)割裂的體系,為上層應(yīng)用提供一數(shù)一源的數(shù)據(jù)基礎(chǔ)設(shè)施,助力客戶實(shí)現(xiàn)提升數(shù)據(jù)管理水平、降低成本、提升運(yùn)營(yíng)效率、提升用戶體驗(yàn)等目標(biāo)。
目前,巨杉數(shù)據(jù)庫(kù)已經(jīng)在超過(guò)100家金融銀行客戶規(guī)?;暇€使用,覆蓋國(guó)有銀行、股份制銀行、省級(jí)農(nóng)信、城商行、保險(xiǎn)、證券等金融客戶,已經(jīng)正式生產(chǎn)上線的系統(tǒng)中最大運(yùn)行集群,數(shù)據(jù)量達(dá)1.2萬(wàn)億行,容量達(dá)3PB,規(guī)模超過(guò)400臺(tái)服務(wù)器,積累了豐富的最佳實(shí)踐及案例,幫助客戶構(gòu)建起數(shù)據(jù)平臺(tái)最佳底座。
數(shù)據(jù)湖和數(shù)據(jù)倉(cāng)庫(kù),原本是大數(shù)據(jù)技術(shù)條件下構(gòu)建分布式系統(tǒng)的兩種數(shù)據(jù)架構(gòu)設(shè)計(jì)取向。而融合后的湖倉(cāng)一體,為業(yè)界和用戶展現(xiàn)了一種湖與倉(cāng)互相補(bǔ)充、協(xié)同工作的架構(gòu)。未來(lái),巨杉數(shù)據(jù)庫(kù)將不斷優(yōu)化湖倉(cāng)一體數(shù)據(jù)服務(wù)平臺(tái),探索和嘗試更多湖倉(cāng)一體解決方案,幫助企業(yè)釋放全量數(shù)據(jù)價(jià)值。
了解更多內(nèi)容可關(guān)注微信公眾號(hào):巨杉數(shù)據(jù)庫(kù)
免責(zé)聲明:市場(chǎng)有風(fēng)險(xiǎn),選擇需謹(jǐn)慎!此文僅供參考,不作買(mǎi)賣(mài)依據(jù)。
關(guān)鍵詞: