社交网站的数据挖掘与分析

社交网站的数据挖掘与分析 pdf epub mobi txt 电子书 下载 2025

出版者:机械工业出版社
作者:Matthew A·Russell
出品人:
页数:301
译者:师蓉
出版时间:2012-2
价格:59.00元
装帧:平装
isbn号码:9787111369608
丛书系列:
图书标签:
  • 数据挖掘
  • 社交网站
  • 数据分析
  • 互联网
  • 统计学
  • 机器学习
  • web2.0
  • social_media
  • 社交网络
  • 数据挖掘
  • 数据分析
  • 用户行为
  • 大数据
  • 机器学习
  • 网络分析
  • 社交媒体
  • 数据科学
  • 可视化
想要找书就要到 小美书屋
立刻按 ctrl+D收藏本页
你会得到大惊喜!!

具体描述

Facebook、Twitter和LinkedIn产生了大量宝贵的社交数据,但是你怎样才能找出谁通过社交媒介正在进行联系?他们在讨论些什么?或者他们在哪儿?这本简洁而且具有可操作性的书将揭示如何回答这些问题甚至更多的问题。你将学到如何组合社交网络数据、分析技术,如何通过可视化帮助你找到你一直在社交世界中寻找的内容,以及你闻所未闻的有用信息。

每个独立的章节介绍了在社交网络的不同领域挖掘数据的技术,这些领域包括博客和电子邮件。你所需要具备的就是一定的编程经验和学习基本的Python工具的意愿。

•获得对社交网络世界的直观认识

•使用GitHub上灵活的脚本来获取从诸如Twitter、Facebook和LinkedIn之类的社交网络API中的数据

•学习如何应用便捷的Python工具来交叉分析你所收集的数据

•通过XHTML朋友圈探讨基于微格式的社交联系

•应用诸如TF-IDF、余弦相似性、搭配分析、文档摘要、派系检测之类的先进挖掘技术

•通过基于HTML5和JavaScript工具包的网络技术建立交互式可视化

作者简介

马修·罗塞尔(Matthew A.Russell),Digital Reasoning Systems公司的技术副总裁和Zaffra公司的负责人,是热爱数据挖掘、开源和Web应用技术的计算机科学家。他也是《Dojo: The Dofinitive Guide》(O'Reilly出版社)的作者。在LinkedIn上联系他或在Twitter上关注@ptwobrussell,可随时关注他的最新动态。

目录信息

前言1
第1章绪论:Twitter 数据的处理9
Python 开发工具的安装9
Twitter 数据的收集和处理11
小结24
第2章微格式:语义标记和常识碰撞26
XFN 和朋友27
使用XFN 来探讨社交关系29
地理坐标:兴趣爱好的共同主线37
(以健康的名义)对菜谱进行交叉分析41
对餐厅评论的搜集43
小结45
第3章邮箱:虽然老套却很好用47
mbox:Unix 的入门级邮箱48
mbox+CouchDB= 随意的Email 分析54
将对话线程化到一起70
使用SIMILE Timeline 将邮件“事件”可视化79
分析你自己的邮件数据82
小结84
第4章Twitter :朋友、关注者和Setwise 操作85
REST 风格的和OAuth-Cladded API86
干练而中肯的数据采集器90
友谊图的构建108
小结116
第5章Twitter:tweet ,所有的tweet ,只有tweet 118
笔PK 剑:和tweet PK 机枪(?!?)118
对tweet 的分析(每次一个实体)121
并置潜在的社交网站(或#JustinBieber VS #TeaParty)144
对大量tweet 的可视化155
小结163
第6章LinkedIn :为了乐趣(和利润?)将职业网络聚类164
聚类的动机165
按职位将联系人聚类167
获取补充个人信息183
从地理上聚类网络188
小结192
第7章Google Buzz:TF-IDF 、余弦相似性和搭配194
Buzz=Twitter+ 博客(???)195
使用NLTK 处理数据198
文本挖掘的基本原则201
查找相似文档208
在二元语法中发Buzz 215
利用Gmail 221
在中断之前试着创建一个搜索引擎……225
小结226
第8章博客及其他:自然语言处理(等)228
NLP :帕累托式介绍228
使用NLTK 的典型NLP 管线231
使用NLTK 检测博客中的句子234
对文件的总结237
以实体为中心的分析:对数据的深层了解245
小结256
第9章Facebook :一体化的奇迹257
利用社交网络数据258
对Facebook 数据的可视化274
小结294
第10 章语义网:简短的讨论296
发展中的变革296
人不可能只靠事实生活297
期望301
· · · · · · (收起)

读后感

评分

评价给的是原书的。 本来是一本还不错的书,看着那些翻译的语句,哎,真操蛋,这是我直接扔垃圾桶的第一本书,翻译的真不行。 再说书的内容,大概过了一遍,内容挺丰富的,包括了邮件、twitter、facebook、linkedin等各个方面的挖掘想法、工具,还是不错的。对于数据分析的关键...  

评分

yes, damn beaver -,-# 社交网站的DM需要用直推来隐藏看似复杂却又简单,做起来简单却确实不是随便谁都能做好的工作。 UPLOAD YOUR SOUL TO THE ULTIMATE INTERNET!哈哈哈哈!

评分

本书介绍不同的社交网络数据分析,由于内容比较宽导致各个领域介绍的不是非常的深入。twitter一节有点过时了,互联网发展太快了。本书代码网址:https://github.com/ptwobrussell/Mining-the-Social-Web  

评分

刚翻了第一章,介绍了很多基于python的工具包,这些之前没有听说过,今后可以继续深入实践。 如果你用python有较长时间了,则强烈推荐。 简单罗列一下: NetworkX,for the creation, manipulation, and study of the structure, dynamics, and functions of complex network...  

评分

虽然使用的语言是python,而且分析的网站都是国内被禁的网站,但是读完这本书后,感到很受启发,其实如果你懂了这本书中的内容,分析其他社交网站也会得心应手,比如说像国内的sina微博,人家提供的API也很有价值啊,你读完这本书,收获会很大。  

用户评价

评分

我真心不该认为这本书跟技术无关,满篇代码啊

评分

浏览过,细看了部分章节,偏于数据的简单分析。书出的不算晚,所以那个时候看还是有点儿收获。对于如今的研究和应用来说,似乎有点儿过时了。当然零基础的人看看应该还不错。

评分

我真心不该认为这本书跟技术无关,满篇代码啊

评分

代码无注释,API失效,上Twitter还得找代理。国内玩家表示自己等级太低,杠不住

评分

代码无注释,API失效,上Twitter还得找代理。国内玩家表示自己等级太低,杠不住

本站所有内容均为互联网搜索引擎提供的公开搜索信息,本站不存储任何数据与内容,任何内容与数据均与本站无关,如有需要请联系相关搜索引擎包括但不限于百度google,bing,sogou

© 2025 book.quotespace.org All Rights Reserved. 小美书屋 版权所有