網(wǎng)絡安全大數(shù)據(jù)分析與實戰(zhàn)
定 價:79 元
叢書名:網(wǎng)絡空間安全技術叢書
《網(wǎng)絡安全大數(shù)據(jù)分析與實戰(zhàn)》深入淺出地介紹了大數(shù)據(jù)安全分析的理論和實踐基礎,涵蓋大數(shù)據(jù)安全概述、機器學習、深度學習、開發(fā)編程工具以及相關法律法規(guī)等內(nèi)容,簡明扼要地介紹了聚類分析、關聯(lián)分析、預測分析及分類所涉及的主流算法,并以實戰(zhàn)導向的綜合案例對大數(shù)據(jù)安全分析的相關知識和技術進行了整合應用。《網(wǎng)絡安全大數(shù)據(jù)分析與實戰(zhàn)》可以作為高校大數(shù)據(jù)安全分析相關專業(yè)課程的教材,也可作為從事信息安全咨詢服務、測評認證、安全建設、安全管理工作的從業(yè)人員及其他大數(shù)據(jù)安全分析相關領域工作人員的技術參考書。
1. 作者權威。本書由網(wǎng)絡安全行業(yè)領先企業(yè)安恒信息組織編寫,作者均為企業(yè)資深的技術專家,有豐富的實戰(zhàn)技術經(jīng)驗。2. 內(nèi)容實用。本書涵蓋了云計算安全關鍵技術、安全運維與服務、國內(nèi)外法律法規(guī)等內(nèi)容,以及云安全工程師認證培訓的全部知識點。
近年來,我國大數(shù)據(jù)產(chǎn)業(yè)的發(fā)展進入爆發(fā)期,越來越多的企業(yè)和組織將大數(shù)據(jù)作為自己經(jīng)營戰(zhàn)略的重要組成部分。大數(shù)據(jù)技術作為一種新興的生產(chǎn)資料和創(chuàng)新要素,必須結合具體的行業(yè)和應用場景才能發(fā)揮其價值,驅(qū)動產(chǎn)業(yè)發(fā)展和轉型。同時,面對日益嚴峻的網(wǎng)絡安全挑戰(zhàn),業(yè)界提出了以數(shù)據(jù)分析為中心的網(wǎng)絡安全防護體系,把主動檢測和自動化應急的希望寄托于日志、流量和威脅情報為數(shù)據(jù)源的智能分析技術,以解決APT攻擊、用戶行為分析這類復雜且隱蔽的網(wǎng)絡安全威脅。而大數(shù)據(jù)分析技術本身是一種普適性的方法論,雖然業(yè)界提出了眾多的大數(shù)據(jù)處理體系和基于統(tǒng)計學或機器學習的方法,但如何將大數(shù)據(jù)智能分析技術應用于復雜的網(wǎng)絡安全防護場景,如何開展大數(shù)據(jù)安全的關聯(lián)分析和綜合研判,仍然是業(yè)界值得深入思考和研究的熱點問題。在這一背景下,大數(shù)據(jù)安全分析師成為稀缺人才。另外,市面上缺少合理地將大數(shù)據(jù)智能分析技術與安全防護場景進行有效結合的書籍,這嚴重制約了安全分析師的成長。杭州安恒信息技術股份有限公司依托自身的安全服務業(yè)務,自主研發(fā)了AiLPHA大數(shù)據(jù)智能安全平臺,具備全網(wǎng)流量處理、異構日志集成、核心數(shù)據(jù)安全分析、辦公應用安全威脅挖掘等前沿大數(shù)據(jù)智能安全威脅挖掘分析與預警管控能力,深耕公安、網(wǎng)信、金融等多個行業(yè)及領域,曾連續(xù)三年獲評工信部示范試點項目,并獲得浙江省計算機學會、浙江省計算機行業(yè)協(xié)會2020年度優(yōu)秀產(chǎn)品獎及2020年度中國網(wǎng)絡安全與信息產(chǎn)業(yè)金智獎等多個獎項。鑒于目前關于大數(shù)據(jù)安全分析的圖書較少,很難找到一本書系統(tǒng)、有針對性地對大數(shù)據(jù)安全分析這一重要技能以理論與實踐相結合的方式進行全方位的介紹。因此,編者希望通過編寫此書,將工作中積累的實踐經(jīng)驗與研究成果分享給廣大讀者。《網(wǎng)絡安全大數(shù)據(jù)分析與實戰(zhàn)》共10章。其中,第1章為大數(shù)據(jù)安全概述,主要介紹大數(shù)據(jù)的定義與特征、大數(shù)據(jù)平臺與架構、大數(shù)據(jù)應用案例以及大數(shù)據(jù)分析技術在安全中的應用,幫助讀者建立對大數(shù)據(jù)安全分析的整體認知;第2章是大數(shù)據(jù)安全分析基礎,從理論基礎和實踐基礎出發(fā),對大數(shù)據(jù)安全分析的基本概念、思路、算法及Python等常見編程工具進行了簡單的介紹;第3章為大數(shù)據(jù)分析工程技術,對大數(shù)據(jù)采集、存儲、搜索、計算引擎以及數(shù)據(jù)可視化的常用方法與工具進行了系統(tǒng)的介紹;第4章是機器學習和深度學習,首先介紹了機器學習的基本定義、適用場景,以及監(jiān)督學習和無監(jiān)督學習算法的概念,然后對深度學習的相關概念、核心思想等進行了闡述;第5章是分類算法,選擇了分類算法中典型的五個算法,即決策樹、樸素貝葉斯、K近鄰(KNN)模型、支持向量機(SVM)和BP神經(jīng)網(wǎng)絡,從算法原理、案例分析及算法優(yōu)缺點等方面進行了介紹;第6章是預測分析,主要目的是介紹統(tǒng)計預測的基本概念及典型的統(tǒng)計預測方法,如時間序列、回歸分析等,并引導讀者如何使用不同的預測分析方法;第7章是關聯(lián)分析,對關聯(lián)分析的基本概念、Apriori算法和FP-growth算法原理,以及應用場景進行了詳細的闡述;第8章是聚類分析,介紹了歐氏距離、曼哈頓距離和閔可夫斯基距離等相似度計算方法,以及層次聚類、k-means聚類和EM聚類三個經(jīng)典聚類算法的原理和案例等;第9章是大數(shù)據(jù)安全分析應用,圍繞僵尸網(wǎng)絡檢測、惡意URL檢測、WebShell檢測及Malware檢測四類應用展開討論,以便讀者能夠更好地理解前面章節(jié)的算法在實際中的應用;第10章是大數(shù)據(jù)安全相關法律法規(guī),介紹了現(xiàn)行大數(shù)據(jù)安全的國家政策、法治體系建設,以及大數(shù)據(jù)安全分析相關的行為規(guī)范,為讀者之后的從業(yè)道路提出了警示。《網(wǎng)絡安全大數(shù)據(jù)分析與實戰(zhàn)》以理論聯(lián)系實際為指導原則,將大數(shù)據(jù)安全分析的理論知識、工具和實踐案例進行有機結合,可作為普通高等院校和職業(yè)院校相關專業(yè)的課程教材,以及網(wǎng)絡安全技術從業(yè)人員的參考用書。讀者在閱讀本書的過程中,不必執(zhí)著于弄懂算法推導的步驟,對于難度較大的算法只需理解即可,若能輔以實踐操作將理論付諸應用,將能加深對大數(shù)據(jù)安全分析技能的理解。《網(wǎng)絡安全大數(shù)據(jù)分析與實戰(zhàn)》主要由孫佳、苗春雨、劉博編寫,另外,談修竹、姜鵬、莫凡、聶桂兵、楊錦峰、陳子杰、龍文潔、吳鳴旦、金碧霞、郭婷婷、陳美璇、黃施君、葉雷鵬和王倫也參與了本書的編寫和審稿校對工作。大數(shù)據(jù)安全分析須在法律法規(guī)允許、目標單位授權的情況下實施,切勿將本書介紹的方法和手段在未經(jīng)允許的情況下,針對任何生產(chǎn)系統(tǒng)使用。同時,要格外關注大數(shù)據(jù)安全分析過程中的保密性和規(guī)范性指導。在此,對所有參與本書編寫、審閱和出版等工作的人員表示感謝。由于編者水平有限,本書不妥之處在所難免,望廣大網(wǎng)絡安全專家、讀者朋友批評指正,共同為我國網(wǎng)絡安全技術人才培養(yǎng)和人才認證體系建設而努力。編者
1. 孫佳,獲浙江大學和馬里蘭大學信息管理本碩學位,現(xiàn)任安恒信息資深數(shù)據(jù)研究員。對大數(shù)據(jù)挖掘、機器學習在信息安全領域的應用有深入研究,同時致力于大數(shù)據(jù)安全分析的教育工作。曾擔任美國硅谷互聯(lián)網(wǎng)公司數(shù)據(jù)科學家,從事大數(shù)據(jù)建模、定量預測、產(chǎn)品優(yōu)化等工作。2. 苗春雨,博士,杭州安恒信息高級副總裁。西安電子科技大學、中國科學技術大學等多所高校企業(yè)研究生導師,擅長網(wǎng)絡安全防護體系、物聯(lián)網(wǎng)安全,發(fā)表各類學術論文50余篇,專利和軟著20余項,出版專著和教材6本。3. 劉博,杭州安恒信息首席科學家,美國馬里蘭大學計算機博士。完成態(tài)勢感知、數(shù)據(jù)安全、隱私計算等領域300余項技術發(fā)明專利。主導和重點參與、省級重大科研項目9項。擔任浙大安恒前沿研究中心副主任、大數(shù)據(jù)態(tài)勢感知國地研究中心副主任、之江實驗室網(wǎng)絡安全研究中心副主任等。
前言第1章 大數(shù)據(jù)安全概述1.1 大數(shù)據(jù)相關理論1.1.1 大數(shù)據(jù)產(chǎn)生的背景1.1.2 大數(shù)據(jù)的定義與構成1.1.3 大數(shù)據(jù)的特征與價值1.2 大數(shù)據(jù)相關技術1.2.1 大數(shù)據(jù)平臺與架構1.2.2 大數(shù)據(jù)分析常用工具1.3 大數(shù)據(jù)應用案例1.3.1 社交網(wǎng)絡廣告投放系統(tǒng)1.3.2 圍棋智能AlphaGo1.3.3 圖像識別1.4 大數(shù)據(jù)分析技術在安全中的應用1.4.1 安全需要大數(shù)據(jù)1.4.2 安全大數(shù)據(jù)分析技術基礎及分析思路本章小結課后習題第2章 大數(shù)據(jù)安全分析基礎2.1 大數(shù)據(jù)分析理論基礎2.1.1 基本概念2.1.2 分析思路2.1.3 分析算法2.1.4 常見安全應用場景的特征及檢測方法2.2 大數(shù)據(jù)分析實踐基礎2.2.1 編程工具2.2.2 編程環(huán)境2.2.3 Python基礎知識本章小結課后習題第3章 大數(shù)據(jù)分析工程技術3.1 數(shù)據(jù)采集3.1.1 數(shù)據(jù)采集的概念3.1.2 日志采集工具Logstash3.2 非結構化存儲3.2.1 HDFS的基本信息3.2.2 HDFS常用命令3.2.3 HDFS管理命令3.3 結構化存儲3.3.1 HBase基本介紹3.3.2 HBase中的基本概念3.3.3 Hbase常用命令3.4 數(shù)據(jù)搜索3.4.1 Elasticsearch基本概念3.4.2 副本復制機制3.4.3 映射和分詞3.4.4 映射管理3.4.5 索引管理命令3.4.6 搜索3.4.7 聚合分析3.5 實時計算引擎3.5.1 基本概念3.5.2 主流的大數(shù)據(jù)流計算引擎3.5.3 Apache Flink3.6 批量計算引擎3.6.1 Apache Spark項目簡介3.6.2 Spark核心模塊3.6.3 Spark與Hadoop的區(qū)別3.7 計算管理調(diào)度3.7.1 任務管理調(diào)度中的挑戰(zhàn)3.7.2 Airflow介紹3.7.3 任務DAG與任務依賴3.7.4 Airflow Hook3.7.5 Airflow Operator3.7.6 Airflow命令3.8 數(shù)據(jù)可視化3.8.1 明確表達意圖、選擇數(shù)據(jù)3.8.2 拆解信息圖的要素3.8.3 關于色彩、字體、圖標3.8.4 可視化的交互考慮3.8.5 人類視覺缺陷及對數(shù)據(jù)可視化的影響3.8.6 數(shù)據(jù)可視化工具3.8.7 數(shù)據(jù)可視化類庫本章小結課后習題第4章 機器學習和深度學習4.1 機器學習的基本概念4.1.1 基本定義4.1.2 應用場景4.2 機器學習的算法分類4.2.1 監(jiān)督學習算法4.2.2 無監(jiān)督學習算法4.2.3 特殊算法4.3 深度學習基本理論4.3.1 相關概念4.3.2 深度學習的特點4.4 深度學習的進展4.4.1 AlphaGo戰(zhàn)勝李世石4.4.2 圖像識別領域深度學習超越人類4.4.3 目標識別領域深度學習推動無人駕駛的跨越式發(fā)展4.5 深度學習核心思想4.5.1 卷積神經(jīng)網(wǎng)絡(CNN)4.5.2 遞歸神經(jīng)網(wǎng)絡(RNN)4.5.3 長短期記憶網(wǎng)絡(LSTM)本章小結課后習題第5章 分類算法5.1 決策樹5.1.1 基本概念5.1.2 典型算法介紹5.1.3 案例分析及算法優(yōu)缺點5.2 樸素貝葉斯算法5.2.1 概念及原理5.2.2 案例分析及算法優(yōu)缺點5.3 K近鄰(KNN)5.3.1 基本概念及原理5.3.2 案例分析及算法優(yōu)缺點5.4 支持向量機(SVM)算法5.4.1 基本概念及原理5.4.2 案例分析及算法優(yōu)缺點5.5 BP神經(jīng)網(wǎng)絡5.5.1 基本概念5.5.2 算法原理5.5.3 案例分析及算法優(yōu)缺點本章小結課后習題第6章 預測分析6.1 統(tǒng)計預測6.1.1 統(tǒng)計預測的概念及作用6.1.2 統(tǒng)計預測方法的分類與選擇6.1.3 統(tǒng)計預測的原則與步驟6.2 時間序列分析6.2.1 時間序列的概念6.2.2 移動平均模型6.2.3 指數(shù)平滑模型6.2.4 隨機時間序列模型6.3 回歸分析6.3.1 回歸分析的原理6.3.2 線性回歸6.3.3 邏輯回歸本章小結課后習題第7章 關聯(lián)分析7.1 基本概念7.1.1 項與項集7.1.2 關聯(lián)規(guī)則及相關度量7.2 Apriori算法7.2.1 Apriori算法原理7.2.2 Apriori算法示例7.3 FP-Growth算法7.3.1 FP-Growth算法原理7.3.2 FP-Growth算法示例7.4 關聯(lián)分析應用場景本章小結課后習題第8章 聚類分析8.1 聚類概述8.1.1 基本概念8.1.2 聚類分析的應用8.2 相似度(距離)計算8.2.1 歐氏距離8.2.2 曼哈頓距離8.2.3 閔可夫斯基距離8.2.4 馬氏距離8.2.5 夾角余弦8.3 層次聚類8.3.1 基本概念及原理8.3.2 案例分析8.4 k-means聚類8.4.1 基本概念及原理8.4.2 案例分析8.5 EM聚類8.5.1 基本原理與概念8.5.2 案例分析本章小結