在不知道多長(zhǎng)的子序列能更好的表示可執(zhí)行文件的情況下,只能以固定窗口大小在字節(jié)碼序列中滑動(dòng),產(chǎn)生大量的短序列,由機(jī)器學(xué)習(xí)方法選擇可能區(qū)分惡意軟件和良性軟件的短序列作為特征,產(chǎn)生短序列的方法叫n-grams?!?80074ff13b2”的字節(jié)碼序列,如果以3-grams產(chǎn)生連續(xù)部分重疊的短序列,將得到“080074”、“0074ff”、“74ff13”、“ff13b2”四個(gè)短序列。每個(gè)短序列特征的權(quán)重表示有多種方法。**簡(jiǎn)單的方法是如果該短序列在具體樣本中出現(xiàn),就表示為1;如果沒有出現(xiàn),就表示為0,也可以用。本實(shí)施例采用3-grams方法提取特征,3-grams產(chǎn)生的短序列非常龐大,將產(chǎn)生224=(16,777,216)個(gè)特征,如此龐大的特征集在計(jì)算機(jī)內(nèi)存中存儲(chǔ)和算法效率上都是問題。如果短序列特征的tf較小,對(duì)機(jī)器學(xué)習(xí)可能沒有意義,選取了tf**高的5000個(gè)短序列特征,計(jì)算每個(gè)短序列特征的,每個(gè)短序列特征的權(quán)重是判斷其所在軟件樣本是否為惡意軟件的依據(jù),也是區(qū)分每個(gè)軟件樣本的依據(jù)。(4)前端融合前端融合的架構(gòu)如圖4所示,前端融合方式將三種模態(tài)的特征合并,然后輸入深度神經(jīng)網(wǎng)絡(luò),隱藏層的***函數(shù)為relu,輸出層的***函數(shù)是sigmoid,中間使用dropout層進(jìn)行正則化,防止過擬合,優(yōu)化器。兼容性測(cè)試涵蓋35款設(shè)備,通過率91.4%。北京第三方軟件檢測(cè)機(jī)構(gòu)
所述生成軟件樣本的dll和api信息特征視圖,是先統(tǒng)計(jì)所有類別已知的軟件樣本的pe可執(zhí)行文件引用的dll和api信息,從中選取引用頻率**高的多個(gè)dll和api信息;然后判斷當(dāng)前的軟件樣本的導(dǎo)入節(jié)里是否存在選擇出的某個(gè)引用頻率**高的dll和api信息,如存在,則將當(dāng)前軟件樣本的該dll或api信息以1表示,否則將其以0表示,從而對(duì)當(dāng)前軟件樣本的所有dll和api信息進(jìn)行表示形成當(dāng)前軟件樣本的dll和api信息特征視圖。進(jìn)一步的,所述生成軟件樣本的格式信息特征視圖,是從當(dāng)前軟件樣本的pe格式結(jié)構(gòu)信息中選取可能區(qū)分惡意軟件和良性軟件的pe格式結(jié)構(gòu)特征,形成當(dāng)前軟件樣本的格式信息特征視圖。進(jìn)一步的,所述從當(dāng)前軟件樣本的pe格式結(jié)構(gòu)信息中選取可能區(qū)分惡意軟件和良性軟件的pe格式結(jié)構(gòu)特征,是從當(dāng)前軟件樣本的pe格式結(jié)構(gòu)信息中確定存在特定格式異常的pe格式結(jié)構(gòu)特征以及存在明顯的統(tǒng)計(jì)差異的格式結(jié)構(gòu)特征;所述特定格式異常包括:(1)代碼從**后一節(jié)開始執(zhí)行,(2)節(jié)頭部可疑的屬性,(3)pe可選頭部有效尺寸的值不正確,(4)節(jié)之間的“間縫”,(5)可疑的代碼重定向,(6)可疑的代碼節(jié)名稱,(7)可疑的頭部***,(8)來自,(9)導(dǎo)入地址表被修改,(10)多個(gè)pe頭部,(11)可疑的重定位信息,。青海軟件評(píng)測(cè)公司數(shù)據(jù)安全與合規(guī):艾策科技的最佳實(shí)踐。
每一種信息的來源或者形式,都可以稱為一種模態(tài)。例如,人有觸覺,聽覺,視覺,嗅覺。多模態(tài)機(jī)器學(xué)習(xí)旨在通過機(jī)器學(xué)習(xí)的方法實(shí)現(xiàn)處理和理解多源模態(tài)信息的能力。多模態(tài)學(xué)習(xí)從1970年代起步,經(jīng)歷了幾個(gè)發(fā)展階段,在2010年后***步入深度學(xué)習(xí)(deeplearning)階段。在某種意義上,深度學(xué)習(xí)可以被看作是允許我們“混合和匹配”不同模型以創(chuàng)建復(fù)雜的深度多模態(tài)模型。目前,多模態(tài)數(shù)據(jù)融合主要有三種融合方式:前端融合(early-fusion)即數(shù)據(jù)水平融合(data-levelfusion)、后端融合(late-fusion)即決策水平融合(decision-levelfusion)以及中間融合(intermediate-fusion)。前端融合將多個(gè)**的數(shù)據(jù)集融合成一個(gè)單一的特征向量空間,然后將其用作機(jī)器學(xué)習(xí)算法的輸入,訓(xùn)練機(jī)器學(xué)習(xí)模型,如圖1所示。由于多模態(tài)數(shù)據(jù)的前端融合往往無法充分利用多個(gè)模態(tài)數(shù)據(jù)間的互補(bǔ)性,且前端融合的原始數(shù)據(jù)通常包含大量的冗余信息。因此,多模態(tài)前端融合方法常常與特征提取方法相結(jié)合以剔除冗余信息,基于領(lǐng)域經(jīng)驗(yàn)從每個(gè)模態(tài)中提取更高等別的特征表示,或者應(yīng)用深度學(xué)習(xí)算法直接學(xué)習(xí)特征表示,然后在特性級(jí)別上進(jìn)行融合。后端融合則是將不同模態(tài)數(shù)據(jù)分別訓(xùn)練好的分類器輸出決策進(jìn)行融合,如圖2所示。
后端融合模型的10折交叉驗(yàn)證的準(zhǔn)確率是%,對(duì)數(shù)損失是,混淆矩陣如圖13所示,規(guī)范化后的混淆矩陣如圖14所示。后端融合模型的roc曲線如圖15所示,其顯示后端融合模型的auc值為。(6)中間融合中間融合的架構(gòu)如圖16所示,中間融合方式用深度神經(jīng)網(wǎng)絡(luò)從三種模態(tài)的特征分別抽取高等特征表示,然后合并學(xué)習(xí)得到的特征表示,再作為下一個(gè)深度神經(jīng)網(wǎng)絡(luò)的輸入訓(xùn)練模型,隱藏層的***函數(shù)為relu,輸出層的***函數(shù)是sigmoid,中間使用dropout層進(jìn)行正則化,防止過擬合,優(yōu)化器(optimizer)采用的是adagrad,batch_size是40。圖16中,用于抽取dll和api信息特征視圖的深度神經(jīng)網(wǎng)絡(luò)包含3個(gè)隱含層,其***個(gè)隱含層的神經(jīng)元個(gè)數(shù)是128,第二個(gè)隱含層的神經(jīng)元個(gè)數(shù)是64,第三個(gè)隱含層的神經(jīng)元個(gè)數(shù)是32,且3個(gè)隱含層中間間隔設(shè)置有dropout層。用于抽取格式信息特征視圖的深度神經(jīng)網(wǎng)絡(luò)包含2個(gè)隱含層,其***個(gè)隱含層的神經(jīng)元個(gè)數(shù)是64,其第二個(gè)隱含層的神經(jīng)元個(gè)數(shù)是32,且2個(gè)隱含層中間設(shè)置有dropout層。用于抽取字節(jié)碼n-grams特征視圖的深度神經(jīng)網(wǎng)絡(luò)包含4個(gè)隱含層,其***個(gè)隱含層的神經(jīng)元個(gè)數(shù)是512,第二個(gè)隱含層的神經(jīng)元個(gè)數(shù)是384,第三個(gè)隱含層的神經(jīng)元個(gè)數(shù)是256,第四個(gè)隱含層的神經(jīng)元個(gè)數(shù)是125。第三方測(cè)評(píng)顯示軟件運(yùn)行穩(wěn)定性達(dá)99.8%,未發(fā)現(xiàn)重大系統(tǒng)崩潰隱患。
什么是軟件測(cè)試通過手工和自動(dòng)化工具對(duì)被測(cè)對(duì)象進(jìn)行檢測(cè),驗(yàn)證實(shí)際結(jié)果和預(yù)期結(jié)果之間的差異。軟件測(cè)試的原則1測(cè)試是為了證明軟件存在缺陷2測(cè)試應(yīng)該盡早介入3注意測(cè)試缺陷的群集效應(yīng)80-204殺蟲劑現(xiàn)象5合法數(shù)據(jù)和不合法數(shù)據(jù)和邊界值,網(wǎng)絡(luò)異常和電源斷電等6回歸測(cè)試防止出現(xiàn)更多問題7妥善保存一切測(cè)試文檔軟件測(cè)試的目的1暴露軟件中的缺陷和BUG2記錄軟件運(yùn)行中產(chǎn)生的一些數(shù)據(jù),為開發(fā)提供改良的數(shù)據(jù)支持為什么需要軟件測(cè)試1功能實(shí)現(xiàn)且正確執(zhí)行2軟件運(yùn)行的信息數(shù)據(jù)如果一個(gè)產(chǎn)品開發(fā)完成之后發(fā)現(xiàn)了很多問題,說明此軟件開發(fā)過程很可能是有缺陷的,因此,軟件測(cè)試的目的是保證整個(gè)軟件開發(fā)過程是高質(zhì)量的。測(cè)試分類1單元測(cè)試分單元2集成測(cè)試多個(gè)單元3系統(tǒng)測(cè)試用戶角度-功能主體4驗(yàn)證測(cè)試α測(cè)試-內(nèi)測(cè)β測(cè)試-公測(cè)UAT測(cè)試-客戶驗(yàn)收使用系統(tǒng)測(cè)試分類1功能測(cè)試2性能測(cè)試3安全測(cè)試4兼容性測(cè)試測(cè)試方法1按照測(cè)試對(duì)象分類白盒測(cè)試黑盒測(cè)試灰盒測(cè)試2按照測(cè)試對(duì)象是否執(zhí)行分類靜態(tài)測(cè)試動(dòng)態(tài)測(cè)試3按照測(cè)試手段進(jìn)行分類手工測(cè)試靈活改變測(cè)試操作和環(huán)境自動(dòng)化測(cè)試1自己寫腳本2第三方工具進(jìn)行測(cè)試軟件質(zhì)量1維護(hù)性2移植性3效率性4可靠性5易用性6功能性軟件測(cè)試流程1需求分析2設(shè)計(jì)用例3評(píng)審用例4。代碼質(zhì)量評(píng)估顯示注釋覆蓋率不足30%需加強(qiáng)。大連軟件檢測(cè)報(bào)告費(fèi)用
代碼審計(jì)發(fā)現(xiàn)2處潛在內(nèi)存泄漏風(fēng)險(xiǎn),建議版本迭代修復(fù)。北京第三方軟件檢測(cè)機(jī)構(gòu)
本書內(nèi)容充實(shí)、實(shí)用性強(qiáng),可作為高職高專院校計(jì)算機(jī)軟件軟件測(cè)試技術(shù)課程的教材,也可作為有關(guān)軟件測(cè)試的培訓(xùn)教材,對(duì)從事軟件測(cè)試實(shí)際工作的相關(guān)技術(shù)人員也具有一定的參考價(jià)值。目錄前言第1章軟件測(cè)試基本知識(shí)第2章測(cè)試計(jì)劃第3章測(cè)試設(shè)計(jì)和開發(fā)第4章執(zhí)行測(cè)試第5章測(cè)試技術(shù)與應(yīng)用第6章軟件測(cè)試工具第7章測(cè)試文檔實(shí)例附錄IEEE模板參考文獻(xiàn)軟件測(cè)試技術(shù)圖書3基本信息書號(hào):軟件測(cè)試技術(shù)7-113-07054作者:李慶義定價(jià):出版日期:套系名稱:21世紀(jì)高校計(jì)算機(jī)應(yīng)用技術(shù)系列規(guī)劃教材出版單位:**鐵道出版社內(nèi)容簡(jiǎn)介本書主要介紹軟件適用測(cè)試技術(shù)。內(nèi)容分為三部分,***部分為概念基礎(chǔ)、測(cè)試?yán)碚摰谋尘凹鞍l(fā)展,簡(jiǎn)要地分析了當(dāng)前測(cè)試技術(shù)的現(xiàn)狀;第二部分介紹軟件測(cè)試的程序分析技術(shù)、測(cè)試技術(shù),軟件測(cè)試的方法和策略,分析了軟件業(yè)在測(cè)試方面的研究成果,并總結(jié)了測(cè)試的基本原則和一些好的實(shí)踐經(jīng)驗(yàn);第三部分介紹了兩種測(cè)試工具軟件——基于Windows的WinRunner和服務(wù)器負(fù)載測(cè)試軟件WAS。本書結(jié)合實(shí)際,從一些具體的實(shí)例出發(fā),介紹軟件測(cè)試的一些基本概念和方法,分析出軟件測(cè)試的基本理論知識(shí),適用性比較強(qiáng)。北京第三方軟件檢測(cè)機(jī)構(gòu)