社交网站数据如同深埋地下的“金矿”,如何利用这些数据来发现哪些人正通过社交媒介进行联系?他们正在谈论什么?或者他们在哪儿?本书第2版对上一版内容进行了全面更新和修订,它将揭示回答这些问题的方法与技巧。你将学到如何获取、分析和汇总散落于社交网站(包括Facebook、Twitter、LinkedIn、Google+、 GitHub、邮件、网站和博客等)的数据,以及如何通过可视化找到你一直在社交世界中寻找的内容和你闻所未闻的有用信息。
■ 借助IPython Notebook、自然语言工具包、NetworkX和其他科学计算工具挖掘主流社交网站
■ 使用高级文本挖掘技术(如聚类和TF-IDF)来提取人类语言数据中有价值的知识
■ 通过发现GitHub上人、编程语言和代码工程间的亲密性,构建兴趣图谱
■ 利用D3.js进行交互式可视化,充分发挥HTML5和JavaScript工具包的灵活特性
■ 以“问题-解决方案-讨论”的方式详细讲解深入挖掘Twitter数据的实用技术,并提供代码示例
《社交网站的数据挖掘与分析(原书第2版)》的配套代码在公开的GitHub代码库中进行维护,可以通过一站式虚拟机来访问,你只需要使用方便易用的IPython Notebook,即可进入愉快的交互式学习情景。
Matthew A. Russell Digital Reasoning Systems公司首席技术官(CTO)、Zaffra公司负责人。作为一名计算机科学家,他热衷于数据挖掘、开源软件开发和创造技术以扩展人类智能。
苏统华,博士,硕士生导师,CUDA研究中心以及教学中心负责人。主要研究方向包括:物联网大数据智能信息处理、大规模并行计算、模式识别、智能媒体交互与计算等。作为自然手写中文文本识别的开拓者,四年内代表工作被同行大篇幅他引约300次;他所建立的HIT-MW库为全世界100多家科研院所采用;目前负责国家自然科学基金项目2项。2013年,他领导的研究组在文档分析和识别国际会议(ICDAR’2013)上获得手写汉字识别竞赛的双料冠军;2014年,两项手写文字识别核心技术授权给某高新技术公司,正在为超过200万终端用户提供技术服务。著有英文专著《Chinese Handwriting Recognition: An Algorithmic Perspective》(德国施普林格出版社),出版5本大数据分析方面的译作(机械工业出版社)。
原本是想学些数据分析的算法和思想,但是拿到这本书之后挺失望。看到第四章,全在讲如何使用twitter等社交网站的api。 只能当拓展知识面看看,了解下书里面讲到的开源工具。 另外,书的价格还不算便宜。
评分本书介绍不同的社交网络数据分析,由于内容比较宽导致各个领域介绍的不是非常的深入。twitter一节有点过时了,互联网发展太快了。本书代码网址:https://github.com/ptwobrussell/Mining-the-Social-Web
评分评价给的是原书的。 本来是一本还不错的书,看着那些翻译的语句,哎,真操蛋,这是我直接扔垃圾桶的第一本书,翻译的真不行。 再说书的内容,大概过了一遍,内容挺丰富的,包括了邮件、twitter、facebook、linkedin等各个方面的挖掘想法、工具,还是不错的。对于数据分析的关键...
评分本书介绍不同的社交网络数据分析,由于内容比较宽导致各个领域介绍的不是非常的深入。twitter一节有点过时了,互联网发展太快了。本书代码网址:https://github.com/ptwobrussell/Mining-the-Social-Web
评分评价给的是原书的。 本来是一本还不错的书,看着那些翻译的语句,哎,真操蛋,这是我直接扔垃圾桶的第一本书,翻译的真不行。 再说书的内容,大概过了一遍,内容挺丰富的,包括了邮件、twitter、facebook、linkedin等各个方面的挖掘想法、工具,还是不错的。对于数据分析的关键...
还行吧,领英的可用
评分还行吧,领英的可用
评分没想到twitter,facebook,linkedin,google+,github,都可以用Python这么玩,APIs+Python Libs+可视化,inspired,非常好玩
评分主要是介绍国外几个社交网站的python 访问API,鲜有有意思的数据挖掘案例和思路,且代码也有点旧了
评分泛泛而谈,有胜于无
本站所有内容均为互联网搜索引擎提供的公开搜索信息,本站不存储任何数据与内容,任何内容与数据均与本站无关,如有需要请联系相关搜索引擎包括但不限于百度,google,bing,sogou 等
© 2025 book.quotespace.org All Rights Reserved. 小美书屋 版权所有