全書分為三大部分:
第一部分,主要討論有關增強數據密集型應用係統所需的若乾基本原則。首先開篇第1章即瞄準目標:可靠性、可擴展性與可維護性,如何認識這些問題以及如何達成目標。第2章我們比較瞭多種不同的數據模型和查詢語言,討論各自的適用場景。接下來第3章主要針對存儲引擎,即數據庫是如何安排磁盤結構從而提高檢索效率。第4章轉嚮數據編碼(序列化)方麵,包括常見模式的演化曆程。
第二部分,我們將從單機的數據存儲轉嚮跨機器的分布式係統,這是擴展性的重要一步,但隨之而來的是各種挑戰。所以將依次討論數據遠程復製(第5章)、數據分區(第6章)以及事務(第7章)。接下來的第8章包括分布式係統的更多細節,以及分布式環境如何達成一緻性與共識(第9章)。
第三部分,主要針對産生派生數據的係統,所謂派生數據主要指在異構係統中,如果無法用一個數據源來解決所有問題,那麼一種自然的方式就是集成多個不同的數據庫、緩存模塊以及索引模塊等。首先第10章以批處理開始來處理派生數據,緊接著第11章采用流式處理。第12章總結之前介紹的多種技術,並分析討論未來構建可靠、可擴展和可維護應用係統可能的新方嚮或方法。
作者簡介
Martin Kleppmann是英國劍橋大學分布式係統方嚮的研究員。此前,他曾是LinkedIn和Rapportive等互聯網公司的軟件工程師,負責大規模數據基礎設施建設。在此過程中他遇到過一些睏難,因此他希望這本書能夠幫助讀者避免重蹈覆轍。Martin還是一位活躍的會議演講者、博主和開源貢獻者。他認為,每個人都應該學習深刻的技術理念,對技術的深入理解能幫助我們開發齣更好的軟件。
譯者簡介
趙軍平, 大數據存儲與分析資深開發者與推廣者(EMC 10餘年),GPU異構計算的親曆者。中國計算機協會專傢委員,DELL EMC資深架構師。12年係統研發、創新與團隊管理經驗,擅長數據存儲與保護, 雲計算與大數據實時分析,GPU異構加速優化等。相關領域已申請中、美技術專利100餘項,並多次在SNIA,LinuxConf,Hadoop Summit, Nvidia GPU Tech Conf等做技術分享,持續關注數據密集和計算密集相關技術的演進、融閤與賦能推廣。
呂雲鬆,北京大學計算機碩士,碩士及DELL EMC中國研究院實習期間專注於大數據實時流式處理相關的研究。現就職於華為2012中軟院黎曼實驗室,主要從事深度學習的研發。
耿煜,DELL EMC架構師兼GTM負責人,緻力於推廣企業級數字化轉型方案。深耕分布式架構以及雲計算12年,先後任職於ChinaCache,Sun Microsystems以及EMC等公司。
李三平,美國麻省大學計算機工程專業博士,DELL EMC中國研究院首席科學傢,研究方嚮為機器學習、深度學習、智能運維、遙感影像等。已在IEEE Transactions期刊和會議上發錶論文數十篇,申請美國專利20餘項。推崇簡約,熱衷機器學習。
Data is at the center of many challenges in system design today. Difficult issues need to be figured out, such as scalability, consistency, reliability, efficiency, and maintainability. In addition, we have an overwhelming variety of tools, including relati...
評分Martin Kleppmann 不仅是个牛逼的程序员,更是一个极富社会责任和人文关怀的牛逼程序员。而这是更难能可贵的。 习武之人讲究“习武先修德”。Martin Kleppmann 亦是如此。他用前十一章教会我们如何处理海量数据,用最后一章告诉我们如何正确使用数据。要保护用户隐私、要对自己...
評分 評分作者的态度与高度于书的结尾再见一斑。 “As software and data are having such a large impact on the world, we engineers must remember that we carry a responsibility to work toward the kind of world that we want to live in: a world that treats people with huma...
評分1.数据模型 从数据库的数据模型上,可以将数据库分为关系型、文档型以及图型数据库等。这三类数据库在形式和使用的场景上各有不同。 1.1.关系型 关系型模型基于集合论中的关系理论,将数据视为Tuple的集合。关系型在1970年被提出,人们一开始质疑这类技术是否能高效地实现,但...
書是好書,但是對我有點超綱瞭,有幾章雲裏霧裏;吐槽第三部分很多錯彆字、翻譯不通順;當做是第一遍通讀一下。
评分花瞭一個多月終於讀完瞭,被作者的高屋建瓴所摺服,這本書偏嚮於學院派,但不乏工程上的指導意義。很多東西需要反復得讀甚至去查看每章後麵的文獻纔能加深理解。第二部分關於分布式共識、一緻性的內容非常精彩,我甚至拿它在團隊做瞭技術分享。最後發現作者是個比特幣懷疑論者。
评分20190815第一遍。啃瞭大半個月纔啃完,一二部分對我很有幫助,基本上梳理並討論瞭現有工業界分布式係統的各種理論及其實現細節。這本書應該作為後端架構的必讀書目,對很多籠罩著光環的各種架構服務很有祛媚效果。每章後麵的參考文獻是個大寶藏,需要好好閱讀。
评分CRUD程序員進階必讀之書。近年來讀的最爽的技術書,很多方麵在實際工作中都涉及到瞭,並且給齣瞭自己的解決方案,但是看完本書,想把以前的再實現一下——雖然這是幾乎不可能的。
评分名不虛傳,分布式係統的基本問題都提到瞭,而且各種解決方案的優缺點都有。講的沒有那麼實用,也沒有那麼理論,在工業與學術之間平衡的很好。
本站所有內容均為互聯網搜索引擎提供的公開搜索信息,本站不存儲任何數據與內容,任何內容與數據均與本站無關,如有需要請聯繫相關搜索引擎包括但不限於百度,google,bing,sogou 等
© 2025 book.quotespace.org All Rights Reserved. 小美書屋 版权所有