駕馭文本

駕馭文本 pdf epub mobi txt 電子書 下載2025

Grant Ingersoll是一位工程師、講師和培訓師,也是Lucene代碼的提交者已經機器學習項目Mahout的聯閤創始人。

Thomas Morton是OpenNLP和Maximum Entropy(最大熵)的主要開發者。

Drew Farris是一位技術顧問、軟件開發人員及Mahout、Lucene和Solr的貢獻者。

譯者簡介

王斌,博士,中國科學院信息工程研究所研究員,博士生導師,研究方嚮為信息檢索與自然語言處理。主持國傢級、省部級科研項目20餘項,發錶學術論文120餘篇。現為中國中文信息學會理事、信息檢索專委會、社會媒體處理專委會及語言與知識計算專業委員會委員,《中文信息學報》編委,中國計算機學會高級會員及中文信息處理專委會委員。

出版者:電子工業齣版社
作者:Grant S. Ingersoll(格蘭特.英格索爾)
出品人:博文視點
頁數:340
译者:王斌
出版時間:2015-7-22
價格:79.00元
裝幀:平裝
isbn號碼:9787121252303
叢書系列:
圖書標籤:
  • 自然語言處理 
  • NLP 
  • 數據挖掘 
  • 機器學習 
  • 計算機 
  • 編程 
  • 人工智能&數據挖掘 
  • 非C++ 
  •  
想要找書就要到 小美書屋
立刻按 ctrl+D收藏本頁
你會得到大驚喜!!

文本處理是目前互聯網內容應用(如搜索引擎、推薦引擎)的關鍵技術。本書涵蓋瞭文本處理概念和技術的多個方麵,包括文本預處理、搜索、字符串匹配、信息抽取、命名實體識彆、分類、聚類、標簽生成、摘要、問答等。本書的特點在於通過實例來理解文本處理的這些概念和技術,讀者利用現有的開源工具就可以自己實現這些實例。

具體描述

讀後感

評分

偏重实践的书,理论部分略有欠缺。最重要的是:只讨论了Java。现在NLP应该Python是主流。 ---------------------------------- ---------------------------------- ---------------------------------- ---------------------------------- ---------------------------------...

評分

偏重实践的书,理论部分略有欠缺。最重要的是:只讨论了Java。现在NLP应该Python是主流。 ---------------------------------- ---------------------------------- ---------------------------------- ---------------------------------- ---------------------------------...

評分

偏重实践的书,理论部分略有欠缺。最重要的是:只讨论了Java。现在NLP应该Python是主流。 ---------------------------------- ---------------------------------- ---------------------------------- ---------------------------------- ---------------------------------...

評分

还是那句话,有英文版的就绝不要读中文版的,特别是对于技术书籍。翻译的低级错误真是太多了。我就读了中文版不到一章就发现好多坑。 吐槽开始: 中文版77、81页:3.6.1 数量判定 3.6.2 判断数量 这他么玩文字游戏呢!换个位置就好了?! 对应的英文版是3.6.1 Judging qualit...  

評分

还是那句话,有英文版的就绝不要读中文版的,特别是对于技术书籍。翻译的低级错误真是太多了。我就读了中文版不到一章就发现好多坑。 吐槽开始: 中文版77、81页:3.6.1 数量判定 3.6.2 判断数量 这他么玩文字游戏呢!换个位置就好了?! 对应的英文版是3.6.1 Judging qualit...  

用戶評價

评分

駕馭文本的關鍵是通過OpenNLP清洗文本數據提取關鍵信息,連帶文本內容一起保存到Lucene中,通過Lucene自身的查詢能力發現與問題或查詢匹配的內容,根據這個原理再加上點機器學習的過程,可以實現自動分類、自動打標簽、簡單問答係統。

评分

工具書,開拓思路。用Lucene、Solr能做哪些。英文在分詞、詞性、句法分析等方麵都要比中文簡單。

评分

工具書,開拓思路。用Lucene、Solr能做哪些。英文在分詞、詞性、句法分析等方麵都要比中文簡單。

评分

駕馭文本的關鍵是通過OpenNLP清洗文本數據提取關鍵信息,連帶文本內容一起保存到Lucene中,通過Lucene自身的查詢能力發現與問題或查詢匹配的內容,根據這個原理再加上點機器學習的過程,可以實現自動分類、自動打標簽、簡單問答係統。

评分

Jolt生産力大奬得主!

本站所有內容均為互聯網搜索引擎提供的公開搜索信息,本站不存儲任何數據與內容,任何內容與數據均與本站無關,如有需要請聯繫相關搜索引擎包括但不限於百度google,bing,sogou

© 2025 book.quotespace.org All Rights Reserved. 小美書屋 版权所有