社交網站的數據挖掘與分析

社交網站的數據挖掘與分析 pdf epub mobi txt 電子書 下載2025

出版者:機械工業齣版社
作者:Matthew A·Russell
出品人:
頁數:301
译者:師蓉
出版時間:2012-2
價格:59.00元
裝幀:平裝
isbn號碼:9787111369608
叢書系列:
圖書標籤:
  • 數據挖掘
  • 社交網站
  • 數據分析
  • 互聯網
  • 統計學
  • 機器學習
  • web2.0
  • social_media
  • 社交網絡
  • 數據挖掘
  • 數據分析
  • 用戶行為
  • 大數據
  • 機器學習
  • 網絡分析
  • 社交媒體
  • 數據科學
  • 可視化
想要找書就要到 小美書屋
立刻按 ctrl+D收藏本頁
你會得到大驚喜!!

具體描述

Facebook、Twitter和LinkedIn産生瞭大量寶貴的社交數據,但是你怎樣纔能找齣誰通過社交媒介正在進行聯係?他們在討論些什麼?或者他們在哪兒?這本簡潔而且具有可操作性的書將揭示如何迴答這些問題甚至更多的問題。你將學到如何組閤社交網絡數據、分析技術,如何通過可視化幫助你找到你一直在社交世界中尋找的內容,以及你聞所未聞的有用信息。

每個獨立的章節介紹瞭在社交網絡的不同領域挖掘數據的技術,這些領域包括博客和電子郵件。你所需要具備的就是一定的編程經驗和學習基本的Python工具的意願。

•獲得對社交網絡世界的直觀認識

•使用GitHub上靈活的腳本來獲取從諸如Twitter、Facebook和LinkedIn之類的社交網絡API中的數據

•學習如何應用便捷的Python工具來交叉分析你所收集的數據

•通過XHTML朋友圈探討基於微格式的社交聯係

•應用諸如TF-IDF、餘弦相似性、搭配分析、文檔摘要、派係檢測之類的先進挖掘技術

•通過基於HTML5和JavaScript工具包的網絡技術建立交互式可視化

著者簡介

馬修·羅塞爾(Matthew A.Russell),Digital Reasoning Systems公司的技術副總裁和Zaffra公司的負責人,是熱愛數據挖掘、開源和Web應用技術的計算機科學傢。他也是《Dojo: The Dofinitive Guide》(O'Reilly齣版社)的作者。在LinkedIn上聯係他或在Twitter上關注@ptwobrussell,可隨時關注他的最新動態。

圖書目錄

前言1
第1章緒論:Twitter 數據的處理9
Python 開發工具的安裝9
Twitter 數據的收集和處理11
小結24
第2章微格式:語義標記和常識碰撞26
XFN 和朋友27
使用XFN 來探討社交關係29
地理坐標:興趣愛好的共同主綫37
(以健康的名義)對菜譜進行交叉分析41
對餐廳評論的搜集43
小結45
第3章郵箱:雖然老套卻很好用47
mbox:Unix 的入門級郵箱48
mbox+CouchDB= 隨意的Email 分析54
將對話綫程化到一起70
使用SIMILE Timeline 將郵件“事件”可視化79
分析你自己的郵件數據82
小結84
第4章Twitter :朋友、關注者和Setwise 操作85
REST 風格的和OAuth-Cladded API86
乾練而中肯的數據采集器90
友誼圖的構建108
小結116
第5章Twitter:tweet ,所有的tweet ,隻有tweet 118
筆PK 劍:和tweet PK 機槍(?!?)118
對tweet 的分析(每次一個實體)121
並置潛在的社交網站(或#JustinBieber VS #TeaParty)144
對大量tweet 的可視化155
小結163
第6章LinkedIn :為瞭樂趣(和利潤?)將職業網絡聚類164
聚類的動機165
按職位將聯係人聚類167
獲取補充個人信息183
從地理上聚類網絡188
小結192
第7章Google Buzz:TF-IDF 、餘弦相似性和搭配194
Buzz=Twitter+ 博客(???)195
使用NLTK 處理數據198
文本挖掘的基本原則201
查找相似文檔208
在二元語法中發Buzz 215
利用Gmail 221
在中斷之前試著創建一個搜索引擎……225
小結226
第8章博客及其他:自然語言處理(等)228
NLP :帕纍托式介紹228
使用NLTK 的典型NLP 管綫231
使用NLTK 檢測博客中的句子234
對文件的總結237
以實體為中心的分析:對數據的深層瞭解245
小結256
第9章Facebook :一體化的奇跡257
利用社交網絡數據258
對Facebook 數據的可視化274
小結294
第10 章語義網:簡短的討論296
發展中的變革296
人不可能隻靠事實生活297
期望301
· · · · · · (收起)

讀後感

評分

虽然使用的语言是python,而且分析的网站都是国内被禁的网站,但是读完这本书后,感到很受启发,其实如果你懂了这本书中的内容,分析其他社交网站也会得心应手,比如说像国内的sina微博,人家提供的API也很有价值啊,你读完这本书,收获会很大。  

評分

Facebook、Twitter和LinkedIn产生了大量宝贵的社交数据,但是你怎样才能找出谁通过社交媒介正在进行联系?他们在讨论些什么?或者他们在哪儿?这本简洁而且具有可操作性的书将揭示如何回答这些问题甚至更多的问题。你将学到如何组合社交网络数据、分析技术,如何通过可视化帮助你...  

評分

Popular social networks such as Facebook, Twitter, and LinkedIn generate a tremendous amount of valuable social data. Who's talking to whom? What are they talking about? How often are they talking? Where are they located? This concise and practical book sho...  

評分

yes, damn beaver -,-# 社交网站的DM需要用直推来隐藏看似复杂却又简单,做起来简单却确实不是随便谁都能做好的工作。 UPLOAD YOUR SOUL TO THE ULTIMATE INTERNET!哈哈哈哈!

評分

刚翻了第一章,介绍了很多基于python的工具包,这些之前没有听说过,今后可以继续深入实践。 如果你用python有较长时间了,则强烈推荐。 简单罗列一下: NetworkX,for the creation, manipulation, and study of the structure, dynamics, and functions of complex network...  

用戶評價

评分

第二版更好,及時更新解決瞭twitter API的問題。 https://github.com/ptwobrussell/Mining-the-Social-Web-2nd-Edition

评分

我真心不該認為這本書跟技術無關,滿篇代碼啊

评分

還行,講瞭很多算法,也給瞭很多代碼。不過數據挖掘,算法和實際能用的係統,不是一會事

评分

Mining the Social Web 中文版。側重介紹如何獲取數據。

评分

代碼無注釋,API失效,上Twitter還得找代理。國內玩傢錶示自己等級太低,杠不住

本站所有內容均為互聯網搜索引擎提供的公開搜索信息,本站不存儲任何數據與內容,任何內容與數據均與本站無關,如有需要請聯繫相關搜索引擎包括但不限於百度google,bing,sogou

© 2025 book.quotespace.org All Rights Reserved. 小美書屋 版权所有