什麼是 Inline 深度學習?

圖形描述 Palo Alto Networks Unit 42 有關惡意軟體傳播/擴散速度和多形性的資料
新攻擊的發動速度遠超過傳統沙箱、Proxy 和獨立簽章技術所能部署的防護。在初次感染後,現代惡意軟體可在數秒內感染數千個以上的系統,遠遠早於防護措施的開發與擴展至整個組織的時間。為了防護進階威脅,組織必須儘快防止從未見過的威脅造成初始感染。目標是將可見性與預防之間的時間縮短為零。多虧了內嵌式深度學習,現在這已經成為可能。
什麼是深度學習?
為了更好地理解內嵌式深度學習的概念,首先定義深度學習和機器學習,然後區分兩者是很有幫助的。深度學習是機器學習 (ML) 的一個子集,它使用人工神經網路來模仿大腦的功能,並從大量非結構化資料中學習。神經網路使用大量非結構化資料進行訓練。它們可以即時從多個資料來源收集、分析和詮釋資訊,而無需人工干预。深度學習在檢視大量網路威脅資料以偵測並避免網路攻擊時,尤其有幫助。深度學習可自動進行特徵萃取,消除對人類的任何依賴z:例如:在對狗、貓或鳥等動物進行分類時,深度學習會確定哪些特徵(例如耳朵、鼻子、眼睛等)是區別每種動物的關鍵。這些先進的能力讓深度學習在改善分析和自動化相關任務方面極為有利。
什麼是機器學習?
機器學習是人工智慧的一種應用,包括解析資料、從資料集學習並應用學習成果來做出明智決策的演算法。一般而言,電腦會收到結構化的資料,並以此作為訓練資料,以提高評估和行動的能力。雖然以機器學習為基礎的基本模型可以隨著時間的推移提高其準確性,但仍需要人為干預。
機器學習 vs. 深度學習
人工智慧 (AI) 越來越多地被運用於各行各業,為自動化任務提供助力。人工智能的兩個大組成部分是機器學習和深度學習。這兩個名詞經常被交替使用,但卻有明顯的差異:
- 機器學習需要資料科學家或工程師以手動方式選擇特徵或分類器,檢查輸出是否符合需求,如果認為產生的預測不準確,則調整演算法。
深度學習消除了人為干預的需求。透過其神經網路將演算法架構成層次,深度學習可以自行判斷預測是否準確。
- 機器學習演算法傾向於採用簡單的架構,例如線性迴歸或判斷樹。機器學習能力也傾向涉及較少的處理能力。它可以相當快速地設定和操作,但可能產生有限的結果。
深度學習複雜得多。雖然它通常需要更強大的硬體、資源和設定時間,但它通常可以立即產生結果,而且即使需要維護,也只需要很少的維護。
- 傳統機器學習演算法所需的資料遠少於深度學習模型。ML 驅動的技術可以使用數千個資料點進行操作;深度學習通常需要數百萬個資料點。所使用的資料大部分也是非結構化的,而且可以包含影像和視訊,讓它可以消除波動並做出高品質的詮釋。
Inline 深度學習如何運作?
深度學習本身已廣泛應用於各行各業,包括網路安全性。由於它可以不斷地演進,並隨著時間的推移從大量的威脅資料中學習,因此已成為預測網路攻擊的關鍵技術。為了進一步發揮其偵測與預防新型網路威脅的效能,一種較新且領先業界的戰術出現了,那就是內嵌式深度學習。在安全性事件發生時,內嵌式深度學習可用於分析和偵測進入網路的惡意流量,並即時封鎖威脅。由於現代威脅行為者使用複雜的技術,使得傳統的安全防禦措施無法發現攻擊,因此這一點至關重要。雖然線上深度學習擁有這些令人難以置信的能力,但它的運作也不會干擾個人使用裝置的能力。它在背景中運行而不被察覺,不會中斷裝置的工作流程或生產力。
利用內嵌式機器學習防護未知威脅
Palo Alto Networks 已推出全球首款以 ML 驅動的下一代防火牆 (NGFW),提供線上機器學習功能來阻擋未知的檔案和網路型威脅。WildFire 和先進的 URL 過濾功能使用專利的無簽章方式,可主動防止武器化檔案、憑證網路釣魚和惡意指令碼,而不會影響企業生產力。Palo Alto Networks 硬體和虛擬 NGFW 可應用全新的 ML 型防禦功能:
- WildFire 內嵌式 ML 以線上速度檢查檔案,並阻擋可攜式執行檔的惡意軟體變種以及 PowerShell 檔案,這些檔案在惡意內容中佔有不成比例的比例。
- URL Filtering 內嵌式 ML 以線上速度檢查未知 URL。此功能可在幾毫秒內識別網路釣魚網頁和惡意 JavaScript,並在線上停止它們,因此您的網路中沒有人會看到它們。
若要瞭解有關 Inline 深度學習的更多資訊,請閱讀 Palo Alto Networks 白皮書: 預防威脅的需求。
- 人為干預
機器學習需要資料科學家或工程師以手動方式選擇特徵或分類器、檢查輸出是否符合需求,以及在認為產生的預測不準確時調整演算法。
深度學習消除了人為干預的需求。透過其神經網路將演算法架構成層次,深度學習可以自行判斷預測是否準確。 - 架構與功耗
機器學習演算法傾向於採用簡單的架構,例如線性迴歸或判斷樹。機器學習能力也傾向涉及較少的處理能力。它可以相當快速地設定和操作,但可能產生有限的結果。
深度學習複雜得多。雖然它通常需要更強大的硬體、資源和設定時間,但它通常可以立即產生結果,而且即使需要維護,也只需要很少的維護。 - 資料需求
傳統機器學習演算法所需的資料遠少於深度學習模型。ML 驅動的技術可以使用數千個資料點進行操作;深度學習通常需要數百萬個資料點。所使用的資料大部分也是非結構化的,而且可以包含影像和視訊,讓它可以消除波動並做出高品質的詮釋。