大數(shù)據(jù)由于其來源的不同,具有數(shù)據(jù)多樣性的特點。對于傳統(tǒng)的數(shù)據(jù)庫,其存儲的數(shù)據(jù)都是結(jié)構(gòu)化數(shù)據(jù),格式規(guī)整,相反大數(shù)據(jù)來源于日志、歷史數(shù)據(jù)、用戶行為記錄等,有的是結(jié)構(gòu)化數(shù)據(jù),而更多的是半結(jié)構(gòu)化或者非結(jié)構(gòu)化數(shù)據(jù),這也正是傳統(tǒng)數(shù)據(jù)庫存儲技術(shù)無法適應(yīng)大數(shù)據(jù)存儲的重要原因之一。所謂存儲格式,也正是由于其數(shù)據(jù)來源不同,應(yīng)用算法繁多,數(shù)據(jù)結(jié)構(gòu)化程度不同,其格式也多種多樣。因而大數(shù)據(jù)的存儲或者處理系統(tǒng)必須對多種數(shù)據(jù)及軟硬件平臺有較好的兼容性來適應(yīng)各種應(yīng)用算法或者數(shù)據(jù)提取轉(zhuǎn)換與加載。存儲系統(tǒng)通常采用多層不同性價比的存儲器件組成存儲層次結(jié)構(gòu)。楊浦區(qū)軟件存儲服務(wù)分類
分布式存儲系統(tǒng)結(jié)構(gòu)中包含一個機頭,這個是存儲系統(tǒng)中較為關(guān)鍵的部件。通常在機頭中有包含兩個控制器,互為備用,避免硬件故障導致整個存儲系統(tǒng)的不可用。機頭中通常包含前端端口和后端端口,前端端口用戶為服務(wù)器提供存儲服務(wù),而后端端口用于擴充存儲系統(tǒng)的容量。通過后端端口機頭可以連接更多的存儲設(shè)備,從而形成一個非常大的存儲資源池。在整個結(jié)構(gòu)中,機頭中是整個存儲系統(tǒng)的關(guān)鍵部件,整個存儲系統(tǒng)的高級功能都在其中實現(xiàn)。控制器中的軟件實現(xiàn)對磁盤的管理,將磁盤抽象化為存儲資源池,然后劃分為LUN提供給服務(wù)器使用。這里的LUN其實就是在服務(wù)器上看到的磁盤。當然,一些集中式存儲本身也是文件服務(wù)器,可以提供共享文件服務(wù)。溫州軟件存儲服務(wù)傳統(tǒng)數(shù)據(jù)存儲模型需要支持盡可能多的應(yīng)用,因此需要具備較好的通用性。
分布式存儲系統(tǒng)一般是由多個服務(wù)器、網(wǎng)絡(luò)設(shè)備和很多存儲介質(zhì)組成。即使在手動部署測試環(huán)境的時候,所涉及的系統(tǒng)架構(gòu)也會是比較復雜的,包括:硬件多樣性。在測試前,需要根據(jù)不同的測試類型采用不同的硬件設(shè)備。譬如硬盤的規(guī)格(SATA盤還是SSD盤),內(nèi)存規(guī)格,以及不同的網(wǎng)絡(luò)類型(TCP/IP,F(xiàn)C,RDMA)等;網(wǎng)絡(luò)要求。分布式系統(tǒng)的特點決定了測試環(huán)境可能運行在多個服務(wù)器、多個機架,甚至是多個數(shù)據(jù)中心上。在測試前,需要模擬構(gòu)建出所需要的網(wǎng)絡(luò)帶寬和時延要求;配置復雜性。由于設(shè)計的軟硬件平臺非常多,整個系統(tǒng)的可配置參數(shù)就非常多,整個配置過程耗時長且容易出錯。
分布式存儲系統(tǒng)是將數(shù)據(jù)分散存儲在多臺單獨的設(shè)備上,并且能夠橫向擴展,利用多臺存儲設(shè)備分擔存儲負荷,利用元數(shù)據(jù)服務(wù)器定位存儲信息,它不但提高了系統(tǒng)的可靠性、可用性和存取效率,還易于擴展。同時,可以將這些分散的存儲設(shè)備構(gòu)建成一個虛擬的大存儲池,供上層應(yīng)用來使用。市場上諸多集群存儲、并行存儲,云存儲等,其實都是基于分布式的架構(gòu),只是廠商不同叫法不同。較近幾年,這種分布式架構(gòu)的存儲系統(tǒng)正在逐步替代傳統(tǒng)的存儲架構(gòu),尤其是在非結(jié)構(gòu)化數(shù)據(jù)的存儲領(lǐng)域發(fā)展非常迅猛。分布式存儲將成為互聯(lián)網(wǎng)的基礎(chǔ)設(shè)施:在傳統(tǒng)互聯(lián)網(wǎng)的數(shù)據(jù)訪問模式上,是依賴于http協(xié)議進行數(shù)據(jù)交互的。
分布式存儲要點:組網(wǎng)架構(gòu):分布式存儲網(wǎng)絡(luò)一般分為三個平面,即業(yè)務(wù)平面、管理平面和均衡平面。業(yè)務(wù)平面,即外部訪問和使用分布式存儲、進行數(shù)據(jù)讀取的平面;管理平面,即分布式存儲管理軟件對存儲節(jié)點進行管理的平面,包括上下電、監(jiān)控和維護操作等;均衡同步平面即存儲節(jié)點之間進行副本數(shù)據(jù)同步和負載均衡的平面。組網(wǎng)協(xié)議上,通常采用IP協(xié)議進行通信和傳輸,在特殊場景,例如對時延敏感場景,也可以采用RDMA網(wǎng)絡(luò)用于業(yè)務(wù)平面和均衡同步平面。分布式存儲這種技術(shù)方式和優(yōu)勢,傳統(tǒng)的互聯(lián)網(wǎng)公司通過控制中心平臺是沒有辦法實現(xiàn)的。楊浦區(qū)軟件存儲服務(wù)分類
分布式存儲系統(tǒng)需要使用多臺服務(wù)器共同存儲數(shù)據(jù)。楊浦區(qū)軟件存儲服務(wù)分類
大數(shù)據(jù)時代,數(shù)據(jù)呈爆式增長。從存儲服務(wù)的發(fā)展趨勢來看,一方面,對數(shù)據(jù)的存儲量的需求越來越大;另一方面,對數(shù)據(jù)的有效管理提出了更高的要求。大數(shù)據(jù)對存儲設(shè)備的容量、讀寫性能、可靠性、擴展性等都提出了更高的要求,需要充分考慮功能集成度、數(shù)據(jù)安全性、數(shù)據(jù)穩(wěn)定性、系統(tǒng)可擴展性、性能及成本各方面因素。大數(shù)據(jù)的存儲及處理不只在于規(guī)模之大,更加要求其傳輸及處理的響應(yīng)速度快。相對于以往較小規(guī)模的數(shù)據(jù)處理,在數(shù)據(jù)中心處理大規(guī)模數(shù)據(jù)時,需要服務(wù)集群有很高的吞吐量才能夠讓巨量的數(shù)據(jù)在應(yīng)用開發(fā)人員“可接受”的時間內(nèi)完成任務(wù)。這不只是對于各種應(yīng)用層面的計算性能要求,更加是對大數(shù)據(jù)存儲管理系統(tǒng)的讀寫吞吐量的要求。楊浦區(qū)軟件存儲服務(wù)分類
上海環(huán)秀技術(shù)服務(wù)中心致力于數(shù)碼、電腦,是一家貿(mào)易型公司。公司業(yè)務(wù)涵蓋網(wǎng)絡(luò)科技,電子科技,信息科技領(lǐng)域內(nèi)的技術(shù)開發(fā),計算機軟件開發(fā)等,價格合理,品質(zhì)有保證。公司注重以質(zhì)量為中心,以服務(wù)為理念,秉持誠信為本的理念,打造數(shù)碼、電腦良好品牌。環(huán)秀秉承“客戶為尊、服務(wù)為榮、創(chuàng)意為先、技術(shù)為實”的經(jīng)營理念,全力打造公司的重點競爭力。