此外格式結(jié)構(gòu)信息具有明顯的語義信息,但基于格式結(jié)構(gòu)信息的檢測方法沒有提取決定軟件行為的代碼節(jié)和數(shù)據(jù)節(jié)信息作為特征。某一種類型的特征都從不同的視角反映刻畫了可執(zhí)行文件的一些性質(zhì),字節(jié)碼n-grams、dll和api信息、格式結(jié)構(gòu)信息都部分捕捉到了惡意軟件和良性軟件間的可區(qū)分信息,但都存在著一定的局限性,不能充分、綜合、整體的表示可執(zhí)行文件的本質(zhì),使得檢測結(jié)果準(zhǔn)確率不高、可靠性低、泛化性和魯棒性不佳。此外,惡意軟件通常偽造出和良性軟件相似的特征,逃避反**軟件的檢測。技術(shù)實(shí)現(xiàn)要素:本發(fā)明實(shí)施例的目的在于提供一種基于多模態(tài)深度學(xué)習(xí)的惡意軟件檢測方法,以解決現(xiàn)有采用二進(jìn)制可執(zhí)行文件的單一特征類型進(jìn)行惡意軟件檢測的檢測方法檢測準(zhǔn)確率不高、檢測可靠性低、泛化性和魯棒性不佳的問題,以及其難以檢測出偽造良性軟件特征的惡意軟件的問題。本發(fā)明實(shí)施例所采用的技術(shù)方案是,基于多模態(tài)深度學(xué)習(xí)的惡意軟件檢測方法,按照以下步驟進(jìn)行:步驟s1、提取軟件樣本的二進(jìn)制可執(zhí)行文件的dll和api信息、pe格式結(jié)構(gòu)信息以及字節(jié)碼n-grams的特征表示,生成軟件樣本的dll和api信息特征視圖、格式信息特征視圖以及字節(jié)碼n-grams特征視圖。深圳艾策信息科技:打造智慧供應(yīng)鏈的關(guān)鍵技術(shù)。軟件信息系統(tǒng)安全檢測公司
3)pe可選頭部有效尺寸的值不正確,(4)節(jié)之間的“間縫”,(5)可疑的代碼重定向,(6)可疑的代碼節(jié)名稱,(7)可疑的頭部***,(8)來自,(9)導(dǎo)入地址表被修改,(10)多個(gè)pe頭部,(11)可疑的重定位信息,(12)把節(jié)裝入到vmm的地址空間,(13)可選頭部的sizeofcode域取值不正確,(14)含有可疑標(biāo)志。存在明顯的統(tǒng)計(jì)差異的格式結(jié)構(gòu)特征包括:(1)無證書表;(2)調(diào)試數(shù)據(jù)明顯小于正常文件,(3).text、.rsrc、.reloc和.rdata的characteristics屬性異常,(4)資源節(jié)的資源個(gè)數(shù)少于正常文件。生成軟件樣本的字節(jié)碼n-grams特征視圖,是統(tǒng)計(jì)了每個(gè)短序列特征的詞頻(termfrequency,tf),即該短序列特征在軟件樣本中出現(xiàn)的頻率。先從當(dāng)前軟件樣本的所有短序列特征中選取詞頻tf**高的多個(gè)短序列特征;然后計(jì)算選取的每個(gè)短序列特征的逆向文件頻率idf與詞頻tf的乘積,并將其作為選取的每個(gè)短序列特征的特征值,,表示該短序列特征表示其所在軟件樣本的能力越強(qiáng);**后在選取的詞頻tf**高的多個(gè)短序列特征中選取,生成字節(jié)碼n-grams特征視圖。:=tf×idf;tf(termfrequency)是詞頻,定義如下:其中,ni,j是短序列特征i在軟件樣本j中出現(xiàn)的次數(shù),∑knk,j指軟件樣本j中所有短序列特征出現(xiàn)的次數(shù)之和。軟件質(zhì)量測試中心滲透測試報(bào)告暴露2個(gè)高危API接口需緊急加固。
12)把節(jié)裝入到vmm的地址空間,(13)可選頭部的sizeofcode域取值不正確,(14)含有可疑標(biāo)志;所述存在明顯的統(tǒng)計(jì)差異的格式結(jié)構(gòu)特征包括:(1)無證書表;(2)調(diào)試數(shù)據(jù)明顯小于正常文件,(3).text、.rsrc、.reloc和.rdata的characteristics屬性異常,(4)資源節(jié)的資源個(gè)數(shù)少于正常文件。進(jìn)一步的,所述生成軟件樣本的字節(jié)碼n-grams特征視圖的具體實(shí)現(xiàn)過程如下:先從當(dāng)前軟件樣本的所有短序列特征中選取詞頻tf**高的多個(gè)短序列特征;然后計(jì)算選取的每個(gè)短序列特征的逆向文件頻率idf與詞頻tf的乘積,并將其作為選取的每個(gè)短序列特征的特征值,,表示該短序列特征表示其所在軟件樣本的能力越強(qiáng);**后在選取的詞頻tf**高的多個(gè)短序列特征中選取,生成字節(jié)碼n-grams特征視圖;:=tf×idf;其中,ni,j是短序列特征i在軟件樣本j中出現(xiàn)的次數(shù),∑knk,j指軟件樣本j中所有短序列特征出現(xiàn)的次數(shù)之和,k為短序列特征總數(shù),1≤i≤k;其中,|d|指軟件樣本j的總數(shù),|{j:i∈j}|指包含短序列特征i的軟件樣本j的數(shù)目。進(jìn)一步的,所述步驟s2采用中間融合方法訓(xùn)練多模態(tài)深度集成模型。
對(duì)一些質(zhì)量要求和可靠性要求較高的模塊,一般要滿足所需條件的組合覆蓋或者路徑覆蓋標(biāo)準(zhǔn)。[2]軟件測試方法集成測試集成測試是軟件測試的第二階段,在這個(gè)階段,通常要對(duì)已經(jīng)嚴(yán)格按照程序設(shè)計(jì)要求和標(biāo)準(zhǔn)組裝起來的模塊同時(shí)進(jìn)行測試,明確該程序結(jié)構(gòu)組裝的正確性,發(fā)現(xiàn)和接口有關(guān)的問題,比如模塊接口的數(shù)據(jù)是否會(huì)在穿越接口時(shí)發(fā)生丟失;各個(gè)模塊之間因某種疏忽而產(chǎn)生不利的影響;將模塊各個(gè)子功能組合起來后產(chǎn)生的功能要求達(dá)不到預(yù)期的功能要求;一些在誤差范圍內(nèi)且可接受的誤差由于長時(shí)間的積累進(jìn)而到達(dá)了不能接受的程度;數(shù)據(jù)庫因單個(gè)模塊發(fā)生錯(cuò)誤造成自身出現(xiàn)錯(cuò)誤等等。同時(shí)因集成測試是界于單元測試和系統(tǒng)測試之間的,所以,集成測試具有承上啟下的作用。因此有關(guān)測試人員必須做好集成測試工作。在這一階段,一般采用的是白盒和黑盒結(jié)合的方法進(jìn)行測試,驗(yàn)證這一階段設(shè)計(jì)的合理性以及需求功能的實(shí)現(xiàn)性。[2]軟件測試方法系統(tǒng)測試一般情況下,系統(tǒng)測試采用黑盒法來進(jìn)行測試的,以此來檢查該系統(tǒng)是否符合軟件需求。本階段的主要測試內(nèi)容包括健壯性測試、性能測試、功能測試、安裝或反安裝測試、用戶界面測試、壓力測試、可靠性及安全性測試等。多平臺(tái)兼容性測試顯示Linux環(huán)境下存在驅(qū)動(dòng)適配問題。
降低成本對(duì)每個(gè)階段都進(jìn)行測試,包括文檔,便于控制項(xiàng)目過程缺點(diǎn)依賴文檔,沒有文檔的項(xiàng)目無法使用,復(fù)雜度很高,實(shí)踐需要很強(qiáng)的管理H模型把測試活動(dòng)完全**出來,將測試準(zhǔn)備和測試執(zhí)行體現(xiàn)出來測試準(zhǔn)備-測試執(zhí)行就緒點(diǎn)其他流程----------設(shè)計(jì)等v模型適用于中小企業(yè)需求在開始必須明確,不適用變更需求w模型適用于中大企業(yè)包括文檔也需要測試(需求分析文檔概要設(shè)計(jì)文檔詳細(xì)設(shè)計(jì)文檔代碼文檔)測試和開發(fā)同步進(jìn)行H模型對(duì)公司參與人員技能和溝通要求高測試階段單元測試-集成測試-系統(tǒng)測試-驗(yàn)證測試是否覆蓋代碼白盒測試-黑盒測試-灰盒測試是否運(yùn)行靜態(tài)測試-動(dòng)態(tài)測試測試手段人工測試-自動(dòng)化測試其他測試回歸測試-冒*測試功能測試一般功能測試-界面測試-易用性測試-安裝測試-兼容性測試性能測試穩(wěn)定性測試-負(fù)載測試-壓力測試-時(shí)間性能-空間性能負(fù)載測試確定在各種工作負(fù)載下,系統(tǒng)各項(xiàng)指標(biāo)變化情況壓力測試:通過確定一個(gè)系統(tǒng)的剛好不能接受的性能點(diǎn)。獲得系統(tǒng)能夠提供的**大服務(wù)級(jí)別測試用例為特定的目的而設(shè)計(jì)的一組測試輸入,執(zhí)行條件和預(yù)期結(jié)果,以便測試是否滿足某個(gè)特定需求。通過大量的測試用例來檢測軟件的運(yùn)行效果,它是指導(dǎo)測試工作進(jìn)行的依據(jù)。5G 與物聯(lián)網(wǎng):深圳艾策的下一個(gè)技術(shù)前沿。北京軟件檢測報(bào)告規(guī)格
基于 AI 視覺識(shí)別的自動(dòng)化檢測系統(tǒng),助力艾策實(shí)現(xiàn)生產(chǎn)線上的零缺陷品控目標(biāo)!軟件信息系統(tǒng)安全檢測公司
后端融合模型的10折交叉驗(yàn)證的準(zhǔn)確率是%,對(duì)數(shù)損失是,混淆矩陣如圖13所示,規(guī)范化后的混淆矩陣如圖14所示。后端融合模型的roc曲線如圖15所示,其顯示后端融合模型的auc值為。(6)中間融合中間融合的架構(gòu)如圖16所示,中間融合方式用深度神經(jīng)網(wǎng)絡(luò)從三種模態(tài)的特征分別抽取高等特征表示,然后合并學(xué)習(xí)得到的特征表示,再作為下一個(gè)深度神經(jīng)網(wǎng)絡(luò)的輸入訓(xùn)練模型,隱藏層的***函數(shù)為relu,輸出層的***函數(shù)是sigmoid,中間使用dropout層進(jìn)行正則化,防止過擬合,優(yōu)化器(optimizer)采用的是adagrad,batch_size是40。圖16中,用于抽取dll和api信息特征視圖的深度神經(jīng)網(wǎng)絡(luò)包含3個(gè)隱含層,其***個(gè)隱含層的神經(jīng)元個(gè)數(shù)是128,第二個(gè)隱含層的神經(jīng)元個(gè)數(shù)是64,第三個(gè)隱含層的神經(jīng)元個(gè)數(shù)是32,且3個(gè)隱含層中間間隔設(shè)置有dropout層。用于抽取格式信息特征視圖的深度神經(jīng)網(wǎng)絡(luò)包含2個(gè)隱含層,其***個(gè)隱含層的神經(jīng)元個(gè)數(shù)是64,其第二個(gè)隱含層的神經(jīng)元個(gè)數(shù)是32,且2個(gè)隱含層中間設(shè)置有dropout層。用于抽取字節(jié)碼n-grams特征視圖的深度神經(jīng)網(wǎng)絡(luò)包含4個(gè)隱含層,其***個(gè)隱含層的神經(jīng)元個(gè)數(shù)是512,第二個(gè)隱含層的神經(jīng)元個(gè)數(shù)是384,第三個(gè)隱含層的神經(jīng)元個(gè)數(shù)是256,第四個(gè)隱含層的神經(jīng)元個(gè)數(shù)是125。軟件信息系統(tǒng)安全檢測公司