2)軟件產(chǎn)品登記測(cè)試流程材料準(zhǔn)備并遞交------實(shí)驗(yàn)室受理------環(huán)境準(zhǔn)備------測(cè)試實(shí)施------輸出報(bào)告------通知客戶------繳費(fèi)并取報(bào)告服務(wù)區(qū)域北京、上海、廣州、深圳、重慶、杭州、南京、蘇州等**各地軟件測(cè)試報(bào)告|軟件檢測(cè)報(bào)告以“軟件質(zhì)量為目標(biāo),貫穿整個(gè)軟件生命周期、覆蓋軟件測(cè)試生命周期”的**測(cè)試服務(wù)模式,真正做到了“軟件測(cè)試應(yīng)該越早介入越好的原則”,從軟件生命周期的每一個(gè)環(huán)節(jié)把控軟件產(chǎn)品質(zhì)量;提供軟件產(chǎn)品質(zhì)量度量依據(jù),提供軟件可靠性分析依據(jù)。軟件成果鑒定測(cè)試結(jié)果可以作為軟件類科技成果鑒定的依據(jù)。提供功能、性能、標(biāo)準(zhǔn)符合性、易用性、安全性、可靠性等專項(xiàng)測(cè)試服務(wù)??萍柬?xiàng)目驗(yàn)收測(cè)試報(bào)告及鑒定結(jié)論,可以真實(shí)反映指標(biāo)的技術(shù)水平和市場(chǎng)價(jià)值,有助于項(xiàng)目成交和產(chǎn)品營銷。企業(yè)數(shù)字化轉(zhuǎn)型指南:艾策科技的實(shí)用建議。cma軟件安全
先將當(dāng)前軟件樣本件的二進(jìn)制可執(zhí)行文件轉(zhuǎn)換為十六進(jìn)制字節(jié)碼序列,然后采用n-grams方法在十六進(jìn)制字節(jié)碼序列中滑動(dòng),產(chǎn)生大量的連續(xù)部分重疊的短序列特征,提取得到當(dāng)前軟件樣本的二進(jìn)制可執(zhí)行文件的字節(jié)碼n-grams的特征表示。生成軟件樣本的dll和api信息特征視圖,是先統(tǒng)計(jì)所有類別已知的軟件樣本的pe可執(zhí)行文件引用的dll和api信息,從中選取引用頻率**高的多個(gè)dll和api信息;然后判斷當(dāng)前的軟件樣本的導(dǎo)入節(jié)里是否存在選擇出的某個(gè)引用頻率**高的dll和api信息,如存在,則將當(dāng)前軟件樣本的該dll或api信息以1表示,否則將其以0表示,從而對(duì)當(dāng)前軟件樣本的所有dll和api信息進(jìn)行表示形成當(dāng)前軟件樣本的dll和api信息特征視圖。生成軟件樣本的格式信息特征視圖,是從當(dāng)前軟件樣本的pe格式結(jié)構(gòu)信息中選取可能區(qū)分惡意軟件和良性軟件的pe格式結(jié)構(gòu)特征,形成當(dāng)前軟件樣本的格式信息特征視圖。從當(dāng)前軟件樣本的pe格式結(jié)構(gòu)信息中選取可能區(qū)分惡意軟件和良性軟件的pe格式結(jié)構(gòu)特征,是從當(dāng)前軟件樣本的pe格式結(jié)構(gòu)信息中確定存在特定格式異常的pe格式結(jié)構(gòu)特征以及存在明顯的統(tǒng)計(jì)差異的格式結(jié)構(gòu)特征。特定格式異常包括:(1)代碼從**后一節(jié)開始執(zhí)行,(2)節(jié)頭部可疑的屬性,。代碼審計(jì)報(bào)告 價(jià)格專業(yè)機(jī)構(gòu)認(rèn)證該程序內(nèi)存管理效率優(yōu)于行業(yè)平均水平23%。
將三種模態(tài)特征和三種融合方法的結(jié)果進(jìn)行了對(duì)比,如表3所示。從表3可以看出,前端融合和中間融合較基于模態(tài)特征的檢測(cè)準(zhǔn)確率更高,損失率更低。后端融合是三種融合方法中較弱的,雖然明顯優(yōu)于基于dll和api信息、pe格式結(jié)構(gòu)特征的實(shí)驗(yàn)結(jié)果,但稍弱于基于字節(jié)碼3-grams特征的結(jié)果。中間融合是三種融合方法中**好的,各項(xiàng)性能指標(biāo)都非常接近**優(yōu)值。表3實(shí)驗(yàn)結(jié)果對(duì)比本實(shí)施例提出了基于多模態(tài)深度學(xué)習(xí)的惡意軟件檢測(cè)方法,提取了三種模態(tài)的特征(dll和api信息、pe格式結(jié)構(gòu)信息和字節(jié)碼3-grams),提出了通過三種融合方式(前端融合、后端融合、中間融合)集成三種模態(tài)的特征,有效提高惡意軟件檢測(cè)的準(zhǔn)確率和魯棒性。實(shí)驗(yàn)結(jié)果顯示,相對(duì)**且互補(bǔ)的特征視圖和不同深度學(xué)習(xí)融合機(jī)制的使用明顯提高了檢測(cè)方法的檢測(cè)能力和泛化性能,其中較優(yōu)的中間融合方法取得了%的準(zhǔn)確率,對(duì)數(shù)損失為,auc值為,各項(xiàng)性能指標(biāo)已接近**優(yōu)值。考慮到樣本集可能存在噪聲,本實(shí)施例提出的方法已取得了比較理想的結(jié)果。由于惡意軟件很難同時(shí)偽造多個(gè)模態(tài)的特征,本實(shí)施例提出的方法比單模態(tài)特征方法更魯棒。以上所述*為本發(fā)明的較佳實(shí)施例而已,并非用于限定本發(fā)明的保護(hù)范圍。
本發(fā)明屬于惡意軟件防護(hù)技術(shù)領(lǐng)域::,涉及一種基于多模態(tài)深度學(xué)習(xí)的惡意軟件檢測(cè)方法。背景技術(shù):::惡意軟件是指在未明確提示用戶或未經(jīng)用戶許可的情況下,故意編制或設(shè)置的,對(duì)網(wǎng)絡(luò)或系統(tǒng)會(huì)產(chǎn)生威脅或潛在威脅的計(jì)算機(jī)軟件。常見的惡意軟件有計(jì)算機(jī)**(簡(jiǎn)稱**)、特洛伊木馬(簡(jiǎn)稱木馬)、計(jì)算機(jī)蠕蟲(簡(jiǎn)稱蠕蟲)、后門、邏輯**等。惡意軟件可能在用戶不知情的情況下竊取計(jì)算機(jī)用戶的信息和隱私,也可能非法獲得計(jì)算機(jī)系統(tǒng)和網(wǎng)絡(luò)資源的控制,破壞計(jì)算機(jī)和網(wǎng)絡(luò)的可信性、完整性和可用性,從而為惡意軟件控制者謀取非法利益。騰訊安全發(fā)布的《2017年度互聯(lián)網(wǎng)安全報(bào)告》顯示,2017年騰訊電腦管家pc端總計(jì)攔截**近30億次,平均每月攔截木馬**近,共發(fā)現(xiàn)**或木馬***。這些數(shù)目龐大、名目繁多的惡意軟件侵蝕著我國的***、經(jīng)濟(jì)、文化、***等各個(gè)領(lǐng)域的信息安全,帶來了前所未有的挑戰(zhàn)。當(dāng)前的反**軟件主要采用基于特征碼的檢測(cè)方法,這種方法通過對(duì)代碼進(jìn)行充分研究,獲得惡意軟件特征值(即每種惡意軟件所獨(dú)有的十六進(jìn)制代碼串),如字節(jié)序列、特定的字符串等,通過匹配查找軟件中是否包含惡意軟件特征庫中的特征碼來判斷其是否為惡意軟件。數(shù)據(jù)驅(qū)動(dòng)決策:艾策科技如何提升企業(yè)競(jìng)爭(zhēng)力。
每一種信息的來源或者形式,都可以稱為一種模態(tài)。例如,人有觸覺,聽覺,視覺,嗅覺。多模態(tài)機(jī)器學(xué)習(xí)旨在通過機(jī)器學(xué)習(xí)的方法實(shí)現(xiàn)處理和理解多源模態(tài)信息的能力。多模態(tài)學(xué)習(xí)從1970年代起步,經(jīng)歷了幾個(gè)發(fā)展階段,在2010年后***步入深度學(xué)習(xí)(deeplearning)階段。在某種意義上,深度學(xué)習(xí)可以被看作是允許我們“混合和匹配”不同模型以創(chuàng)建復(fù)雜的深度多模態(tài)模型。目前,多模態(tài)數(shù)據(jù)融合主要有三種融合方式:前端融合(early-fusion)即數(shù)據(jù)水平融合(data-levelfusion)、后端融合(late-fusion)即決策水平融合(decision-levelfusion)以及中間融合(intermediate-fusion)。前端融合將多個(gè)**的數(shù)據(jù)集融合成一個(gè)單一的特征向量空間,然后將其用作機(jī)器學(xué)習(xí)算法的輸入,訓(xùn)練機(jī)器學(xué)習(xí)模型,如圖1所示。由于多模態(tài)數(shù)據(jù)的前端融合往往無法充分利用多個(gè)模態(tài)數(shù)據(jù)間的互補(bǔ)性,且前端融合的原始數(shù)據(jù)通常包含大量的冗余信息。因此,多模態(tài)前端融合方法常常與特征提取方法相結(jié)合以剔除冗余信息,基于領(lǐng)域經(jīng)驗(yàn)從每個(gè)模態(tài)中提取更高等別的特征表示,或者應(yīng)用深度學(xué)習(xí)算法直接學(xué)習(xí)特征表示,然后在特性級(jí)別上進(jìn)行融合。后端融合則是將不同模態(tài)數(shù)據(jù)分別訓(xùn)練好的分類器輸出決策進(jìn)行融合,如圖2所示。代碼審計(jì)發(fā)現(xiàn)2處潛在內(nèi)存泄漏風(fēng)險(xiǎn),建議版本迭代修復(fù)。天津性能軟件檢測(cè)報(bào)告
艾策檢測(cè)為新能源汽車電池提供安全性能深度解析。cma軟件安全
綜合上面的分析可以看出,惡意軟件的格式信息和良性軟件是有很多差異性的,以可執(zhí)行文件的格式信息作為特征,是識(shí)別已知和未知惡意軟件的可行方法。對(duì)每個(gè)樣本進(jìn)行格式結(jié)構(gòu)解析,提取**每個(gè)樣本實(shí)施例件的格式結(jié)構(gòu)信息,可執(zhí)行文件的格式規(guī)范都由操作系統(tǒng)廠商給出,按照操作系統(tǒng)廠商給出的格式規(guī)范提取即可。pe文件的格式結(jié)構(gòu)有許多屬性,但大多數(shù)屬性無法區(qū)分惡意軟件和良性軟件,經(jīng)過深入分析pe文件的格式結(jié)構(gòu)屬性,提取了可能區(qū)分惡意軟件和良性軟件的136個(gè)格式結(jié)構(gòu)屬性,如表2所示。表2可能區(qū)分惡意軟件和良性軟件的pe格式結(jié)構(gòu)屬性特征描述數(shù)量(個(gè))引用dll的總數(shù)1引用api的總數(shù)1導(dǎo)出表中符號(hào)的總數(shù)1重定位節(jié)的項(xiàng)目總數(shù),連續(xù)的幾個(gè)字節(jié)可能是完成特定功能的一段代碼,或者是可執(zhí)行文件的結(jié)構(gòu)信息,也可能是某個(gè)惡意軟件中特有的字節(jié)碼序列。pe文件可表示為字節(jié)碼序列,惡意軟件可能存在一些共有的字節(jié)碼子序列模式,研究人員直覺上認(rèn)為一些字節(jié)碼子序列在惡意軟件可能以較高頻率出現(xiàn),且這些字節(jié)碼序列和良性軟件字節(jié)碼序列存在明顯差異??蓤?zhí)行文件通常是二進(jìn)制文件,需要把二進(jìn)制文件轉(zhuǎn)換為十六進(jìn)制的文本實(shí)施例件,就得到可執(zhí)行文件的十六進(jìn)制字節(jié)碼序列。cma軟件安全