NLTK基礎教程(用NLTK和Python庫構建機器學習應用) pdf epub mobi txt 電子書 下載 2024
☆☆☆☆☆
簡體網頁||
繁體網頁
[印度]哈登尼亞 (Nitin Hardeniya)
人民郵電齣版社
異步圖書
淩傑
2017-6
0
49.00
平裝
9787115452573
圖書標籤:
機器學習
NLP
python
Python
計算機科學
計算機
nltk
數據分析
喜歡 NLTK基礎教程(用NLTK和Python庫構建機器學習應用) 的讀者還喜歡
下載链接在页面底部
點擊這裡下載
立刻按 ctrl+D收藏本頁
你會得到大驚喜!!
发表于2024-11-25
NLTK基礎教程(用NLTK和Python庫構建機器學習應用) epub 下載 mobi 下載 pdf 下載 txt 電子書 下載 2024
NLTK基礎教程(用NLTK和Python庫構建機器學習應用) epub 下載 mobi 下載 pdf 下載 txt 電子書 下載 2024
NLTK基礎教程(用NLTK和Python庫構建機器學習應用) pdf epub mobi txt 電子書 下載 2024
圖書描述
本書主要介紹如何通過NLTK庫與一些Python庫的結閤從而實現復雜的NLP任務和機器學習應用。全書共分為10章。第1章對NLP進行瞭簡單介紹。第2章、第3章和第4章主要介紹一些通用的預處理技術、專屬於NLP領域的預處理技術以及命名實體識彆技術等。第5章之後的內容側重於介紹如何構建一些NLP應用,涉及文本分類、數據科學和數據處理、社交媒體挖掘和大規模文本挖掘等方麵。
本書適閤 NLP 和機器學習領域的愛好者、對文本處理感興趣的讀者、想要快速學習NLTK的zishenPython程序員以及機器學習領域的研究人員閱讀。
NLTK基礎教程(用NLTK和Python庫構建機器學習應用) 下載 mobi epub pdf txt 電子書
著者簡介
Nitin Hardeniya 數據科學傢,擁有4年以上從業經驗,期間分彆任職於Fidelity、Groupon和[24]7等公司,其業務橫跨各個不同的領域。此外,他還擁有IIIT-H的計算語言學碩士學位,並且是5項客戶體驗專利的作者。
圖書目錄
第1章自然語言處理簡介1
1.1為什麼要學習NLP2
1.2先從Python開始吧5
1.2.1列錶5
1.2.2自助功能6
1.2.3正則錶達式8
1.2.4字典9
1.2.5編寫函數10
1.3嚮NLTK邁進11
1.4練習16
1.5小結17
第2章文本的歧義及其清理18
2.1何謂文本歧義18
2.2文本清理20
2.3語句分離器21
2.4標識化處理22
2.5詞乾提取23
2.6詞形還原24
2.7停用詞移除25
2.8罕見詞移除26
2.9拼寫糾錯26
2.10練習27
2.11小結28
第3章詞性標注29
3.1何謂詞性標注29
3.1.1Stanford標注器32
3.1.2深入瞭解標注器33
3.1.3順序性標注器35
3.1.4Brill標注器37
3.1.5基於機器學習的標注器37
3.2命名實體識彆(NER)38
3.3練習40
3.4小結41
第4章文本結構解析43
4.1淺解析與深解析43
4.2兩種解析方法44
4.3為什麼需要進行解析44
4.4不同的解析器類型46
4.4.1遞歸下降解析器46
4.4.2移位—歸約解析器46
4.4.3圖錶解析器46
4.4.4正則錶達式解析器47
4.5依存性文本解析48
4.6語塊分解50
4.7信息提取53
4.7.1命名實體識彆(NER)53
4.7.2關係提取54
4.8小結55
第5章NLP應用56
5.1構建第一個NLP應用57
5.2其他NLP應用60
5.2.1機器翻譯60
5.2.2統計型機器翻譯61
5.2.3信息檢索62
5.2.4語音識彆64
5.2.5文本分類65
5.2.6信息提取66
5.2.7問答係統67
5.2.8對話係統67
5.2.9詞義消歧67
5.2.10主題建模68
5.2.11語言檢測68
5.2.12光符識彆68
5.3小結68
第6章文本分類70
6.1機器學習71
6.2文本分類72
6.3取樣操作74
6.3.1樸素貝葉斯法76
6.3.2決策樹79
6.3.3隨機梯度下降法80
6.3.4邏輯迴歸81
6.3.5支持嚮量機81
6.4隨機森林算法83
6.5文本聚類83
6.6文本中的主題建模84
6.7參考資料87
6.8小結87
第7章Web爬蟲88
7.1Web爬蟲88
7.2編寫第一個爬蟲程序89
7.3Scrapy庫中的數據流92
7.3.1Scrapy庫的shell93
7.3.2目標項98
7.4生成網站地圖的蜘蛛程序99
7.5目標項管道100
7.6參考資料102
7.7小結102
第8章NLTK與其他Python庫的搭配運用104
8.1NumPy104
8.1.1多維數組105
8.1.2基本運算106
8.1.3從數組中提取數據107
8.1.4復雜矩陣運算108
8.2SciPy112
8.2.1綫性代數113
8.2.2特徵值與特徵嚮量113
8.2.3稀疏矩陣114
8.2.4優化措施115
8.3pandas117
8.3.1讀取數據117
8.3.2數列119
8.3.3列轉換121
8.3.4噪聲數據121
8.4matplotlib123
8.4.1子圖繪製123
8.4.2添加坐標軸124
8.4.3散點圖繪製125
8.4.4條形圖繪製126
8.4.53D繪圖126
8.5參考資料126
8.6小結127
第9章Python中的社交媒體挖掘128
9.1數據收集128
9.2數據提取132
9.3地理可視化134
9.3.1影響力檢測135
9.3.2Facebook135
9.3.3有影響力的朋友139
9.4小結141
第10章大規模文本挖掘142
10.1在Hadoop上使用Python的不同方式142
10.1.1Python的流操作143
10.1.2Hive/Pig下的UDF143
10.1.3流封裝器143
10.2Hadoop上的NLTK144
10.2.1用戶定義函數(UDF)144
10.2.2Python的流操作146
10.3Hadoop上的Scikit—learn147
10.4PySpark150
10.5小結153
· · · · · · (
收起)
NLTK基礎教程(用NLTK和Python庫構建機器學習應用) pdf epub mobi txt 電子書 下載
用戶評價
評分
☆☆☆☆☆
從這本書裏學到瞭如何使用樸素貝葉斯對文本進行分類,對我分析微博特彆有幫助,整體上而言是非常好的一本書,內容非常豐富,自然語言和數據挖掘都能覆蓋到,強烈推薦。
評分
☆☆☆☆☆
入門的好教程,可以當作大綱來看,同時也說明這本書講得不夠深入。但是,扣分的點在於書中有些代碼跑不起來,不夠嚴謹
評分
☆☆☆☆☆
從這本書裏學到瞭如何使用樸素貝葉斯對文本進行分類,對我分析微博特彆有幫助,整體上而言是非常好的一本書,內容非常豐富,自然語言和數據挖掘都能覆蓋到,強烈推薦。
評分
☆☆☆☆☆
流程介紹簡潔易懂 知識麵廣 不錯的入門書。需要再看第二遍
評分
☆☆☆☆☆
從這本書裏學到瞭如何使用樸素貝葉斯對文本進行分類,對我分析微博特彆有幫助,整體上而言是非常好的一本書,內容非常豐富,自然語言和數據挖掘都能覆蓋到,強烈推薦。
讀後感
評分
☆☆☆☆☆
1、版本较老,书内Python版本为2.6.6,所以对应的nltk版本可能也很老。 2、全书都是讲的英文处理,并未涉及到任何中文内容。NLP的中文和英文有很大差别,所以这本书对中文NLP的指导性并不高。 1、版本较老,书内Python版本为2.6.6,所以对应的nltk版本可能也很老。 2、全书都是...
評分
☆☆☆☆☆
1、版本较老,书内Python版本为2.6.6,所以对应的nltk版本可能也很老。 2、全书都是讲的英文处理,并未涉及到任何中文内容。NLP的中文和英文有很大差别,所以这本书对中文NLP的指导性并不高。 1、版本较老,书内Python版本为2.6.6,所以对应的nltk版本可能也很老。 2、全书都是...
評分
☆☆☆☆☆
1、版本较老,书内Python版本为2.6.6,所以对应的nltk版本可能也很老。 2、全书都是讲的英文处理,并未涉及到任何中文内容。NLP的中文和英文有很大差别,所以这本书对中文NLP的指导性并不高。 1、版本较老,书内Python版本为2.6.6,所以对应的nltk版本可能也很老。 2、全书都是...
評分
☆☆☆☆☆
1、版本较老,书内Python版本为2.6.6,所以对应的nltk版本可能也很老。 2、全书都是讲的英文处理,并未涉及到任何中文内容。NLP的中文和英文有很大差别,所以这本书对中文NLP的指导性并不高。 1、版本较老,书内Python版本为2.6.6,所以对应的nltk版本可能也很老。 2、全书都是...
評分
☆☆☆☆☆
1、版本较老,书内Python版本为2.6.6,所以对应的nltk版本可能也很老。 2、全书都是讲的英文处理,并未涉及到任何中文内容。NLP的中文和英文有很大差别,所以这本书对中文NLP的指导性并不高。 1、版本较老,书内Python版本为2.6.6,所以对应的nltk版本可能也很老。 2、全书都是...
類似圖書 點擊查看全場最低價
NLTK基礎教程(用NLTK和Python庫構建機器學習應用) pdf epub mobi txt 電子書 下載 2024