此外格式結(jié)構(gòu)信息具有明顯的語義信息,但基于格式結(jié)構(gòu)信息的檢測方法沒有提取決定軟件行為的代碼節(jié)和數(shù)據(jù)節(jié)信息作為特征。某一種類型的特征都從不同的視角反映刻畫了可執(zhí)行文件的一些性質(zhì),字節(jié)碼n-grams、dll和api信息、格式結(jié)構(gòu)信息都部分捕捉到了惡意軟件和良性軟件間的可區(qū)分信息,但都存在著一定的局限性,不能充分、綜合、整體的表示可執(zhí)行文件的本質(zhì),使得檢測結(jié)果準確率不高、可靠性低、泛化性和魯棒性不佳。此外,惡意軟件通常偽造出和良性軟件相似的特征,逃避反**軟件的檢測。技術(shù)實現(xiàn)要素:本發(fā)明實施例的目的在于提供一種基于多模態(tài)深度學習的惡意軟件檢測方法,以解決現(xiàn)有采用二進制可執(zhí)行文件的單一特征類型進行惡意軟件檢測的檢測方法檢測準確率不高、檢測可靠性低、泛化性和魯棒性不佳的問題,以及其難以檢測出偽造良性軟件特征的惡意軟件的問題。本發(fā)明實施例所采用的技術(shù)方案是,基于多模態(tài)深度學習的惡意軟件檢測方法,按照以下步驟進行:步驟s1、提取軟件樣本的二進制可執(zhí)行文件的dll和api信息、pe格式結(jié)構(gòu)信息以及字節(jié)碼n-grams的特征表示,生成軟件樣本的dll和api信息特征視圖、格式信息特征視圖以及字節(jié)碼n-grams特征視圖。滲透測試報告暴露2個高危API接口需緊急加固。成都軟件第三方測試機構(gòu)
k為短序列特征總數(shù),1≤i≤k??蓤?zhí)行文件長短大小不一,為了防止該特征統(tǒng)計有偏,使用∑knk,j進行歸一化處理。逆向文件頻率(inversedocumentfrequency,idf)是一個短序列特征普遍重要性的度量。某一短序列特征的idf,可以由總樣本實施例件數(shù)目除以包含該短序列特征之樣本實施例件的數(shù)目,再將得到的商取對數(shù)得到:其中,|d|指軟件樣本j的總數(shù),|{j:i∈j}|指包含短序列特征i的軟件樣本j的數(shù)目。idf的主要思想是:如果包含短序列特征i的軟件練樣本越少,也就是|{j:i∈j}|越小,idf越大,則說明短序列特征i具有很好的類別區(qū)分能力。:如果某一特征在某樣本中以較高的頻率出現(xiàn),而包含該特征的樣本數(shù)目較小,可以產(chǎn)生出高權(quán)重的,該特征的。因此,,保留重要的特征。此處選取可能區(qū)分惡意軟件和良性軟件的短序列特征,是因為字節(jié)碼n-grams提取的特征很多,很多都是無效特征,或者效果非常一般的特征,保持這些特征會影響檢測方法的性能和效率,所以要選出有效的特征即可能區(qū)分惡意軟件和良性軟件的短序列特征。步驟s2、將軟件樣本中的類別已知的軟件樣本作為訓練樣本,然后分別采用前端融合方法、后端融合方法和中間融合方法設(shè)計三種不同方案的多模態(tài)數(shù)據(jù)融合方法。軟件功能性測評費用艾策科技案例研究:某跨國企業(yè)的數(shù)字化轉(zhuǎn)型實踐。
在不知道多長的子序列能更好的表示可執(zhí)行文件的情況下,只能以固定窗口大小在字節(jié)碼序列中滑動,產(chǎn)生大量的短序列,由機器學習方法選擇可能區(qū)分惡意軟件和良性軟件的短序列作為特征,產(chǎn)生短序列的方法叫n-grams?!?80074ff13b2”的字節(jié)碼序列,如果以3-grams產(chǎn)生連續(xù)部分重疊的短序列,將得到“080074”、“0074ff”、“74ff13”、“ff13b2”四個短序列。每個短序列特征的權(quán)重表示有多種方法。**簡單的方法是如果該短序列在具體樣本中出現(xiàn),就表示為1;如果沒有出現(xiàn),就表示為0,也可以用。本實施例采用3-grams方法提取特征,3-grams產(chǎn)生的短序列非常龐大,將產(chǎn)生224=(16,777,216)個特征,如此龐大的特征集在計算機內(nèi)存中存儲和算法效率上都是問題。如果短序列特征的tf較小,對機器學習可能沒有意義,選取了tf**高的5000個短序列特征,計算每個短序列特征的,每個短序列特征的權(quán)重是判斷其所在軟件樣本是否為惡意軟件的依據(jù),也是區(qū)分每個軟件樣本的依據(jù)。(4)前端融合前端融合的架構(gòu)如圖4所示,前端融合方式將三種模態(tài)的特征合并,然后輸入深度神經(jīng)網(wǎng)絡(luò),隱藏層的***函數(shù)為relu,輸出層的***函數(shù)是sigmoid,中間使用dropout層進行正則化,防止過擬合,優(yōu)化器。
圖書目錄第1章軟件測試描述第2章常見的軟件測試方法第3章設(shè)計測試第4章程序分析技術(shù)第5章測試分析技術(shù)第6章測試自動化的優(yōu)越性第7章測試計劃與測試標準第8章介紹一種企業(yè)級測試工具第9章學習一種負載測試軟件第10章軟件測試的經(jīng)驗總結(jié)附錄A常見測試術(shù)語附錄B測試技術(shù)分類附錄C常見的編碼錯誤附錄D有關(guān)的測試網(wǎng)站參考文獻軟件測試技術(shù)圖書4書名:軟件測試技術(shù)第2版作者:徐芳層次:高職高專配套:電子課件出版社:機械工業(yè)出版社出版時間:2012-06-26ISBN:978-7-111-37884-6開本:16開定價:目錄第1章開始軟件測試工作第2章執(zhí)行系統(tǒng)測試第3章測試用例設(shè)計第4章測試工具應(yīng)用第5章測試技術(shù)與應(yīng)用第6章成為***的測試組長第7章測試文檔實例詞條圖冊更多圖冊。多平臺兼容性測試顯示Linux環(huán)境下存在驅(qū)動適配問題。
收藏查看我的收藏0有用+1已投票0軟件測試技術(shù)編輯鎖定討論上傳視頻軟件測試技術(shù)是軟件開發(fā)過程中的一個重要組成部分,是貫穿整個軟件開發(fā)生命周期、對軟件產(chǎn)品(包括階段性產(chǎn)品)進行驗證和確認的活動過程,其目的是盡快盡早地發(fā)現(xiàn)在軟件產(chǎn)品中所存在的各種問題——與用戶需求、預(yù)先定義的不一致性。檢查軟件產(chǎn)品的bug。寫成測試報告,交于開發(fā)人員修改。軟件測試人員的基本目標是發(fā)現(xiàn)軟件中的錯誤。中文名軟件測試技術(shù)簡介單元測試、集成測試主要步驟測試設(shè)計與開發(fā)常見測試回歸測試功能測試目錄1主要步驟2基本功能3測試目標4測試目的5常見測試6測試分類7測試工具8同名圖書?圖書1?圖書2?圖書3?圖書4軟件測試技術(shù)主要步驟編輯1、測試計劃2、測試設(shè)計與開發(fā)3、執(zhí)行測試軟件測試技術(shù)基本功能編輯1、驗證(Verification)2、確認(Validation)軟件測試人員應(yīng)具備的知識:1、軟件測試技術(shù)2、被測試應(yīng)用程序及相關(guān)應(yīng)用領(lǐng)域軟件測試技術(shù)測試目標編輯1、軟件測試人員所追求的是盡可能早地找出軟件的錯誤;2、軟件測試人員必須確保找出的軟件錯誤得以關(guān)閉。負載測試證實系統(tǒng)最大承載量較宣傳數(shù)據(jù)低18%。伊春軟件產(chǎn)品登記測試報告費用
隱私合規(guī)檢測確認用戶數(shù)據(jù)加密符合GDPR標準要求。成都軟件第三方測試機構(gòu)
先將當前軟件樣本件的二進制可執(zhí)行文件轉(zhuǎn)換為十六進制字節(jié)碼序列,然后采用n-grams方法在十六進制字節(jié)碼序列中滑動,產(chǎn)生大量的連續(xù)部分重疊的短序列特征,提取得到當前軟件樣本的二進制可執(zhí)行文件的字節(jié)碼n-grams的特征表示。生成軟件樣本的dll和api信息特征視圖,是先統(tǒng)計所有類別已知的軟件樣本的pe可執(zhí)行文件引用的dll和api信息,從中選取引用頻率**高的多個dll和api信息;然后判斷當前的軟件樣本的導入節(jié)里是否存在選擇出的某個引用頻率**高的dll和api信息,如存在,則將當前軟件樣本的該dll或api信息以1表示,否則將其以0表示,從而對當前軟件樣本的所有dll和api信息進行表示形成當前軟件樣本的dll和api信息特征視圖。生成軟件樣本的格式信息特征視圖,是從當前軟件樣本的pe格式結(jié)構(gòu)信息中選取可能區(qū)分惡意軟件和良性軟件的pe格式結(jié)構(gòu)特征,形成當前軟件樣本的格式信息特征視圖。從當前軟件樣本的pe格式結(jié)構(gòu)信息中選取可能區(qū)分惡意軟件和良性軟件的pe格式結(jié)構(gòu)特征,是從當前軟件樣本的pe格式結(jié)構(gòu)信息中確定存在特定格式異常的pe格式結(jié)構(gòu)特征以及存在明顯的統(tǒng)計差異的格式結(jié)構(gòu)特征。特定格式異常包括:(1)代碼從**后一節(jié)開始執(zhí)行,(2)節(jié)頭部可疑的屬性,。成都軟件第三方測試機構(gòu)