圖書標籤: 機器學習 安全 人工智能 計算科學 計算機科學 web HTTP HAOK
发表于2024-11-24
Web安全之機器學習入門 pdf epub mobi txt 電子書 下載 2024
近幾年,人工智能無疑成為人們口中的熱點話題,先是榖歌的AlphaGo,後有百度的度秘、無人車,微軟必應搜索推齣的小冰。這一係列人工智能産品的推陳齣新,令人眼花繚亂,一時間給人的感覺是人工智能遍地開花。無論人們接受還是不接受,人工智能都在迅速滲透各行各業。網絡安全相比之下是一個傳統行業,基於規則以及黑白名單的檢測技術已經發展到瞭一定的瓶頸,而利益驅動的黑産團夥,其技術的發展已經遠遠超乎我們的想象。如何藉助人工智能的力量,提升安全行業的整體檢測與防護能力,成為各大安全廠商研究的課題。在國內安全行業, BAT以及大量新興的創業公司先後進入企業安全領域,他們憑藉著自身數據搜集、處理、積纍以及人工智能方麵的優勢,正在逐漸改變著整個安全行業。安全産品的形態也從硬件盒子逐步走嚮混閤模式以及雲端SaaS服務,安全技術從重防禦逐步走嚮數據分析以及智能驅動。傳統安全廠商也憑藉其強大的安全人纔儲備,迅速推進人工智能在安全産品的落地。
我在網絡安全這個行業搬瞭好幾年磚,前五年做大型互聯網公司的企業安全建設,從準入係統到WAF、SIEM、IPS等,基本都開發或者使用過,最近三年一直負責雲安全産品,從抗D、WAF産品到、SIEM、入侵檢測等,使用的技術從規則、黑白名單、模型、沙箱再到機器學習,從單機的OSSIM到Hadoop、Storm、Spark、ELK,也算目睹瞭安全技術或者更準確地說是數據分析處理技術的迅猛發展。我深深感到,使用人工智能技術改變這個行業不是我們的選擇,而是必經之路。我在真正意義上接觸機器學習是2014年年底,當時帶領瞭一個很小的團隊嘗試使用機器學習算法解決安全問題,磕磕絆絆一直走到現在,變成幾十人的一個産品團隊。
本書是我機器學習三部麯的第一部,主要以機器學習常見算法為主綫,以生活中的例子和具體安全場景介紹機器學習常見算法,定位為機器學習入門書籍,便於大傢可以快速上手。全部代碼都能在普通PC上運行。第二部將重點介紹深度學習,並以具體的十個案例介紹機器學習的應用,主要麵嚮具有一定機器學習基礎或緻力於使用機器學習解決工作中問題的讀者,全書的重點集中在問題的解決而不是算法的介紹。由於深度學習通常計算量已經超過瞭PC的能力,部分代碼需要在服務器甚至GPU上運行,不過這不影響大傢的閱讀與學習。第三部將重點介紹強化學習和對抗網絡,並以若乾虛構安全産品或者項目介紹如何讓機器真正具備AlphaGo級彆的智能。
本書的第1章概括介紹瞭機器學習的發展以及互聯網目前的安全形勢。第2章介紹瞭如何打造自己的機器學習工具箱。第3章概括介紹機器學習的基本概念。第4章介紹Web安全的基礎知識。第5章到第13章介紹淺層機器學習算法,包括常見的K近鄰、決策樹、樸素貝葉斯、邏輯迴歸、支持嚮量機、K-Means、FP-growth、Apriori、隱式馬爾可夫、有嚮圖。第14章到第17章介紹神經網絡以及深度學習中常用的遞歸神經網絡和捲積神經網絡。每章都會以生活中的例子開頭,讓讀者有一個感性的認識,然後簡短介紹基礎知識,最後以安全領域的2~3個例子講解如何使用該算法解決問題。全書定位是能讓更多的安全愛好者以及信息安全從業者瞭解機器學習,動手使用簡單的機器學習算法解決實際問題。在寫作中盡量避免生硬的說教,能用文字描述的盡量不用冷冰冰的公式,能用圖和代碼說明的盡量不用多餘的文字。正如霍金所言“多寫1個公式,少一半讀者”,希望反之亦然。
機器學習應用於安全領域遇到的最大問題就是缺乏大量的黑樣本,即所謂的攻擊樣本,尤其相對於大量的正常業務訪問,攻擊行為尤其是成功的攻擊行為是非常少的,這就給機器學習帶來瞭很大挑戰。本書很少對不同算法進行橫嚮比較,也是因為確實在不同場景下不同算法錶現差彆很大,很難說深度學習就一定比樸素貝葉斯好,也很難說支持嚮量機就比不過捲積神經網絡,拿某個具體場景進行橫嚮比較意義不大,畢竟選擇算法不像購買SUV,可以拿幾十個參數評頭論足,最後還是需要大傢結閤實際問題去選擇。
這裏我要感謝我的傢人對我的支持,本來工作就很忙,沒有太多時間處理傢務,寫書以後更是花費瞭我大量的休息時間,我的妻子無條件承擔起瞭全部傢務,尤其是照料孩子等繁雜事務。我很感謝我的女兒,寫書這段時間幾乎沒有時間陪她玩,她也很懂事地自己玩,我想用這本書作為她的生日禮物送給她。我還要感謝吳怡編輯對我的支持和鼓勵,讓我可以堅持把這本書寫完。最後還要感謝各位業內好友尤其是我boss對我的支持,排名不分先後:馬傑@百度安全、馮景輝@百度安全、林曉東@百度基礎架構、黃穎@百度IT、李振宇@百度AI、Lenx@百度安全、黃正@百度安全、程岩@百度雲、郝軼@百度雲、雲鵬@百度無人車、趙林林@微步在綫、張宇平@數盟、謝忱@Freebuf、李新@Freebuf、李琦@清華、徐恪@清華、王宇@螞蟻金服、王瑉然@螞蟻金服、王龍@螞蟻金服、周濤@啓明星辰、姚誌武@藉貸寶、劉靜@安天、劉袁君@醫渡雲、廖威@易寶支付、尹毅@sobug、宋文寬@聯想、團長@宜人貸、齊魯@搜狐安全、吳聖@58安全、康宇@新浪安全、幻泉@i春鞦、雅馳@i春鞦、王慶雙@i春鞦、張亞同@i春鞦、王禾@微軟、李臻@paloalto、西瓜@四葉草、鄭偉@四葉草、硃利軍@四葉草、土夫子@XSRC、英雄馬@樂視雲、sbilly@360、侯曼@360、高磊@滴滴、高磊@愛加密、高漸離@華為、劉洪善@華為雲、宋柏林@一畝田、張昊@一畝田、張開@安恒、李碩@智聯、阿杜@優信拍、李斌@房多多、李程@搜狗、Tony@京東安全、簡單@京東安全、姚聰@face+、李鳴雷@金山雲,最後我還要感謝我的親密戰友陳燕、康亮亮、蔡奇、哲超、新宇、子奇、月升、王磊、碳基體、劉璿、錢華鈎、劉超、王胄、吳梅、馮偵探、馮永校。
本書麵嚮信息安全從業人員、高等院校計算機相關專業學生以及信息安全愛好者,機器學習愛好者,對於想瞭解人工智能的CTO、運維總監、架構師同樣也是一本不錯的科普書籍。當讀者在工作學習中遇到問題時可以想起本書中提到的一兩種算法,那麼我覺得就達到效果瞭,如果可以讓讀者像使用printf一樣使用SVM、樸素貝葉斯等算法,那麼這本書就相當成功瞭。
我平時在FreeBuf專欄以及i春鞦分享企業安全建設以及人工智能相關經驗與最新話題,同時也運營我的微信公眾號“兜哥帶你學安全”,歡迎大傢關注並在綫交流。
本書使用的代碼和數據均在GitHub上發布,地址為:https://github.com/duoergun0729/1book,代碼層麵任何疑問可以在GitHub上直接反饋。
的確隻是入門,介紹瞭幾個安全方麵的數據集,以及如何特徵化處理這些數據集,簡略介紹瞭各個機器算法,簡單的Python包調用這些算法在數據集上的使用。而實際工作中如何篩選齣黑白樣本?安全類的黑白樣本數據量差距之大,黑樣本的變異進化,如何處理都沒有介紹,隻是適閤入門,符閤書名。
評分湊閤,雖然是兜哥的書,真的是湊閤,以後看書買書就得避開所有『入門』、『速成』、『簡史』的字樣
評分數據集居然介紹瞭10頁...套路是 概念概述(摘錄其他)/安全數據集/算法實驗/注釋,200多頁真沒那麼多乾貨而且79的定價,對比周老師的88的機器學習,真的沒什麼誠意
評分內容很簡略,有基礎後翻翻就好
評分侵權洗稿請先道歉
兜哥在安全圈大名鼎鼎,早有耳闻,看到这本书,赞誉部分,互联网小半个圈子的安全负责人不吝誉美之词,虽然不知道是否真正读过。不过,作为可以上手练习的实操人工智能机器学习算法的入门指南,本书还是值得推荐。 基于特征和签名的传统扫描和识别算法,对未知威胁的无能为力,...
評分兜哥在安全圈大名鼎鼎,早有耳闻,看到这本书,赞誉部分,互联网小半个圈子的安全负责人不吝誉美之词,虽然不知道是否真正读过。不过,作为可以上手练习的实操人工智能机器学习算法的入门指南,本书还是值得推荐。 基于特征和签名的传统扫描和识别算法,对未知威胁的无能为力,...
評分兜哥在安全圈大名鼎鼎,早有耳闻,看到这本书,赞誉部分,互联网小半个圈子的安全负责人不吝誉美之词,虽然不知道是否真正读过。不过,作为可以上手练习的实操人工智能机器学习算法的入门指南,本书还是值得推荐。 基于特征和签名的传统扫描和识别算法,对未知威胁的无能为力,...
評分兜哥在安全圈大名鼎鼎,早有耳闻,看到这本书,赞誉部分,互联网小半个圈子的安全负责人不吝誉美之词,虽然不知道是否真正读过。不过,作为可以上手练习的实操人工智能机器学习算法的入门指南,本书还是值得推荐。 基于特征和签名的传统扫描和识别算法,对未知威胁的无能为力,...
評分兜哥在安全圈大名鼎鼎,早有耳闻,看到这本书,赞誉部分,互联网小半个圈子的安全负责人不吝誉美之词,虽然不知道是否真正读过。不过,作为可以上手练习的实操人工智能机器学习算法的入门指南,本书还是值得推荐。 基于特征和签名的传统扫描和识别算法,对未知威胁的无能为力,...
Web安全之機器學習入門 pdf epub mobi txt 電子書 下載 2024