大數(shù)據(jù)分布式存儲(chǔ)系統(tǒng)原理

來源: 發(fā)布時(shí)間:2022-02-16

    得益于合理的分布式架構(gòu),分布式存儲(chǔ)可預(yù)估并且彈性擴(kuò)展計(jì)算、存儲(chǔ)容量和性能。分布式存儲(chǔ)的水平擴(kuò)展有以下幾個(gè)特性:1)節(jié)點(diǎn)擴(kuò)展后,舊數(shù)據(jù)會(huì)自動(dòng)遷移到新節(jié)點(diǎn),實(shí)現(xiàn)負(fù)載均衡,避點(diǎn)過熱的情況出現(xiàn);2)水平擴(kuò)展只需要將新節(jié)點(diǎn)和原有集群連接到同一網(wǎng)絡(luò),整個(gè)過程不會(huì)對(duì)業(yè)務(wù)造成影響;3)當(dāng)節(jié)點(diǎn)被添加到集群,集群系統(tǒng)的整體容量和性能也隨之線性擴(kuò)展,此后新節(jié)點(diǎn)的資源就會(huì)被管理平臺(tái)接管,被用于分配或者回收。隨著分布式存儲(chǔ)的發(fā)展,存儲(chǔ)行業(yè)的標(biāo)準(zhǔn)化進(jìn)程也不斷推進(jìn),分布式存儲(chǔ)優(yōu)先采用行業(yè)標(biāo)準(zhǔn)接口進(jìn)行存儲(chǔ)接入。在平臺(tái)層面,通過將異構(gòu)存儲(chǔ)資源進(jìn)行抽象化,將傳統(tǒng)的存儲(chǔ)設(shè)備級(jí)的操作封裝成面向存儲(chǔ)資源的操作,從而簡(jiǎn)化異構(gòu)存儲(chǔ)基礎(chǔ)架構(gòu)的操作,以實(shí)現(xiàn)存儲(chǔ)資源的集中管理,并能夠自動(dòng)執(zhí)行創(chuàng)建、變更、回收等整個(gè)存儲(chǔ)生命周期流程,從而降低了存儲(chǔ)采購和管理成本。 布式存儲(chǔ)可實(shí)現(xiàn)集群的健康監(jiān)測(cè),在故障潛伏期即可實(shí)現(xiàn)故障提醒。大數(shù)據(jù)分布式存儲(chǔ)系統(tǒng)原理

說到分布式存儲(chǔ),我們可能都會(huì)聯(lián)想到軟件定義存儲(chǔ)(SoftwareDefinedStorage,即SDS)。代biao全球存儲(chǔ)廠商的權(quán)wei協(xié)會(huì)SNIA(全球網(wǎng)絡(luò)存儲(chǔ)工業(yè)協(xié)會(huì))對(duì)SDS定義:軟件定義存儲(chǔ)包括管理面的標(biāo)準(zhǔn)接口和自動(dòng)化,以及數(shù)據(jù)面Scale-out的塊、文件和對(duì)象存儲(chǔ)服務(wù)?;蛟S我們需要把鏡頭投向21世紀(jì)初期,Google提出分布式存儲(chǔ)架構(gòu)的概念并予以實(shí)踐,在其強(qiáng)大的技術(shù)和維護(hù)團(tuán)隊(duì)支撐下,實(shí)現(xiàn)了基于在標(biāo)準(zhǔn)服務(wù)器上部署自研分布式存儲(chǔ)軟件,構(gòu)建成大規(guī)模存儲(chǔ)集群,以應(yīng)對(duì)其互聯(lián)網(wǎng)搜索業(yè)務(wù)帶來的海量數(shù)據(jù)流。 淮安大數(shù)據(jù)分布式存儲(chǔ)的一般架構(gòu)分布式存儲(chǔ)系統(tǒng)通過復(fù)制協(xié)議將數(shù)據(jù)同步到多個(gè)存儲(chǔ)節(jié)點(diǎn),并確保多個(gè)副本之間的數(shù)據(jù)一致性。

    分布式存儲(chǔ)采用分布式的系統(tǒng)結(jié)構(gòu),將數(shù)據(jù)以切片式或粉碎式分散在多個(gè)du立存儲(chǔ)服務(wù)器。它不但提高了系統(tǒng)的可靠性、可用性和存取效率,還易于擴(kuò)展,將通用硬件引入的不穩(wěn)定因素降到比較低。優(yōu)點(diǎn)如下:1、高性能。2、支持分級(jí)存儲(chǔ)。3、多副本的一致性。4、容災(zāi)與備份。5、彈性擴(kuò)展。6、存儲(chǔ)系統(tǒng)標(biāo)準(zhǔn)化。隨著分布式存儲(chǔ)的發(fā)展,存儲(chǔ)行業(yè)的標(biāo)準(zhǔn)化進(jìn)程也不斷推進(jìn),分布式存儲(chǔ)優(yōu)先采用行業(yè)標(biāo)準(zhǔn)接口進(jìn)行存儲(chǔ)接入。在平臺(tái)層面,通過將異構(gòu)存儲(chǔ)資源進(jìn)行抽象化,將傳統(tǒng)的存儲(chǔ)設(shè)備級(jí)的操作封裝成面向存儲(chǔ)資源的操作,從而簡(jiǎn)化異構(gòu)存儲(chǔ)基礎(chǔ)架構(gòu)的操作,以實(shí)現(xiàn)存儲(chǔ)資源的集中管理,并能夠自動(dòng)執(zhí)行創(chuàng)建、變更、回收等整個(gè)存儲(chǔ)生命周期流程,從而降低了存儲(chǔ)采購和管理成本。

什么是分布式存儲(chǔ)呢?如果一個(gè)存儲(chǔ)系統(tǒng),不管是對(duì)象、塊、文件、kv、log、olap、oltp,只要對(duì)所管理的數(shù)據(jù)做了Partitioning&Replication,不管姿勢(shì)對(duì)不對(duì),其實(shí)都可以歸納于分布式存儲(chǔ)。分布式存儲(chǔ)就是:Partitioning以多機(jī)scale,Replication以災(zāi)備容錯(cuò)。復(fù)制是解決可用性,可擴(kuò)展性和高性能的關(guān)鍵。為了災(zāi)備,數(shù)據(jù)需要冗余存儲(chǔ);為了高可用,服務(wù)需要hotstandby。缺乏災(zāi)備的系統(tǒng)難以在生產(chǎn)環(huán)境使用。元數(shù)據(jù)和數(shù)據(jù)的維護(hù)均離不開復(fù)制,復(fù)制可轉(zhuǎn)移而不可消除。復(fù)制引出了多副本一致性問題,而一致性保證需要考慮各種軟件和硬件故障,以及誤操作。 布式存儲(chǔ)幫助企業(yè)打造智能化的數(shù)據(jù)治理平臺(tái)。

    分布式存儲(chǔ)早期主要用于互聯(lián)網(wǎng)日志、企業(yè)備份歸檔、開發(fā)測(cè)試等場(chǎng)景,這些場(chǎng)景無疑是低價(jià)值場(chǎng)景,成本是第yi訴求甚至訴求。然此一時(shí)彼一時(shí),士別三日也當(dāng)刮目相看。首先是分布式存儲(chǔ)產(chǎn)品能力已今非昔比,逐漸具備了承載企業(yè)高價(jià)值業(yè)務(wù)的關(guān)鍵能力,例如毫秒級(jí)時(shí)延、TB/s級(jí)帶寬、雙活/3DC業(yè)務(wù)級(jí)容災(zāi)、端到端DIF等,無論是結(jié)構(gòu)化數(shù)據(jù)還是非結(jié)構(gòu)化數(shù)據(jù)的承載,功能完備性的比較大短板早已補(bǔ)齊。其次,分布式存儲(chǔ)已走入眾多高價(jià)值關(guān)鍵業(yè)務(wù),如運(yùn)營商BOM業(yè)務(wù)、金融渠道類業(yè)務(wù)以及超算、油藏探測(cè)HPC等高價(jià)值業(yè)務(wù),通過大規(guī)模應(yīng)用實(shí)踐來檢驗(yàn)成色。(小道消息,某些高價(jià)值場(chǎng)景全閃出貨價(jià)達(dá)到1000美金/TB以上啦)看完當(dāng)下還要看看未來,筆者認(rèn)為未來高價(jià)值的非結(jié)構(gòu)化數(shù)據(jù)場(chǎng)景,分布式存儲(chǔ)的版圖還會(huì)持續(xù)擴(kuò)展。如自動(dòng)駕駛訓(xùn)練、4K/8K超高清、5G日志留存等場(chǎng)景,對(duì)多協(xié)議訪問、極zhi帶寬、擴(kuò)展性訴求強(qiáng)烈,分布式存儲(chǔ)已然成為這些未來業(yè)務(wù)的優(yōu)先架構(gòu)。 難言之隱,分布式存儲(chǔ)軟硬件解耦究竟難在哪里?大數(shù)據(jù)分布式存儲(chǔ)系統(tǒng)原理

淺談分布式存儲(chǔ)中的網(wǎng)絡(luò)通信。大數(shù)據(jù)分布式存儲(chǔ)系統(tǒng)原理

分布式存儲(chǔ)構(gòu)建存儲(chǔ)系統(tǒng)時(shí).需要基于成本和性能來考慮,因此存儲(chǔ)系統(tǒng)通常采用多層不同性價(jià)比的存儲(chǔ)器件組成存儲(chǔ)層次結(jié)構(gòu)。大數(shù)據(jù)的規(guī)模大,因此構(gòu)建高效合理的存儲(chǔ)層次結(jié)構(gòu),可以在保證系統(tǒng)性能的前提下,降低系統(tǒng)能耗和構(gòu)建成本,利用數(shù)據(jù)訪問局部性原理.可以從兩個(gè)方面對(duì)存儲(chǔ)層次結(jié)構(gòu)進(jìn)行優(yōu)化。從提高性能的角度,可以通過分析應(yīng)用特征,識(shí)別熱點(diǎn)數(shù)據(jù)并對(duì)其進(jìn)行緩存或預(yù)取,通過高效的緩存預(yù)取算法和合理的緩存容量配比,以提高訪問性能。從降低成本的角度,采用信息生命周期管理方法,將訪問頻率低的冷數(shù)據(jù)遷移到低速廉價(jià)存儲(chǔ)設(shè)備上,可以在小幅犧sheng系統(tǒng)整體性能的基礎(chǔ)上,大幅降低系統(tǒng)的構(gòu)建成本和能耗。 大數(shù)據(jù)分布式存儲(chǔ)系統(tǒng)原理

江蘇魏晉元興智能科技有限公司主要經(jīng)營范圍是數(shù)碼、電腦,擁有一支專業(yè)技術(shù)團(tuán)隊(duì)和良好的市場(chǎng)口碑。魏晉元興智能致力于為客戶提供良好的網(wǎng)絡(luò)安全,VR,MR,VR,AI,視頻監(jiān)控安防,出入口門禁失控制,一切以用戶需求為中心,深受廣大客戶的歡迎。公司秉持誠信為本的經(jīng)營理念,在數(shù)碼、電腦深耕多年,以技術(shù)為先導(dǎo),以自主產(chǎn)品為重點(diǎn),發(fā)揮人才優(yōu)勢(shì),打造數(shù)碼、電腦良好品牌。魏晉元興智能秉承“客戶為尊、服務(wù)為榮、創(chuàng)意為先、技術(shù)為實(shí)”的經(jīng)營理念,全力打造公司的重點(diǎn)競(jìng)爭(zhēng)力。