ggplot2：数据分析与图形艺术 pdf epub mobi txt 电子书下载 2026

简体网页||繁体网页

☆☆☆☆☆

出版者:西安交通大学出版社

作者:哈德利·威克姆 (Hadley Wickham)

出品人:

页数:230

译者:统计之都

出版时间:2013-5-1

价格:CNY 46.00

装帧:平装

isbn号码:9787560549699

丛书系列:R语言应用系列

图书标签:

R
数据分析
可视化
ggplot2
R语言
统计学
统计
图形化
ggplot2
数据分析
图形艺术
可视化
统计
编程
R语言
数据科学
图表
探索

下载链接在页面底部

facebook linkedin mastodon messenger pinterest reddit telegram twitter viber vkontakte whatsapp 复制链接

想要找书就要到小美书屋

book.quotespace.org

立刻按 ctrl+D收藏本页

你会得到大惊喜!!

具体描述

中译本序

每当我们看到一个新的软件，第一反应会是：为什么又要发明一个新软件？ggplot2是R世界里相对还比较年轻的一个包，在它之前，官方R已经有自己的基础图形系统（graphics包）和网格图形系统（grid包），并且Deepayan Sarkar也开发了lattice包，看起来R的世界对图形的支持已经足够强大了。那么我们不禁要问，为什么还要发明一套新的系统？

设计理念

打个比方，想想我们小时候怎样学中文的。最开始的时候我们要识字，不认识字就没法阅读和写作，但我们并不是一直按照一个个汉字学习的，而是通过句子和具体的场景故事学习的。为什么不在小学时背六年字典呢？那样可能认识所有的汉字。原因很简单，光有单字，我们不会说话，也无法阅读和写作。缺的是什么？答案是对文字的组织能力，或者说语法。

R的基础图形系统基本上是一个“纸笔模型”，即：一块画布摆在面前，你可以在这里画几个点，在那里画几条线，指哪儿画哪儿。后来lattice包的出现稍微改善了这种情况，你可以说，我要画散点图或直方图，并且按照某个分类变量给图中的元素上色，此时数据才在画图中扮演了一定的中心角色，我们不用去想具体这个点要用什么颜色（颜色会根据变量自动生成）。然而，lattice继承了R语言的一个糟糕特征，就是参数设置铺天盖地，足以让人窒息，光是一份xyplot()函数的帮助文档，恐怕就够我们消磨一天时间了，更重要的是，lattice仍然面向特定的统计图形，像基础图形系统一样，有直方图、箱线图、条形图等等，它没有一套可以让数据分析者说话的语法。

那么数据分析者是怎样说话的呢？他们从来不会说这条线用#FE09BE颜色，那个点用三角形状，他们只会说，把图中的线用数据中的职业类型变量上色，或图中点的形状对应性别变量。有时候他们画了一幅散点图，但马上他们发现这幅图太拥挤，最好是能具体看一下里面不同收入阶层的特征，所以他们会说，把这幅图拆成七幅小图，每幅图对应一个收入阶层。然后发现散点图的趋势不明显，最好加上回归直线，看看回归模型反映的趋势是什么，或者发现图中离群点太多，最好做一下对数变换，减少大数值对图形的主导性。

从始至终，数据分析者都在数据层面上思考问题，而不是拿着水彩笔和调色板在那里一笔一划作图，而计算机程序员则倾向于画点画线。Leland Wilkinson的著作在理论上改善了这种状况，他提出了一套图形语法，让我们在考虑如何构建一幅图形的时候不再陷在具体的图形元素里面，而是把图形拆分为一些互相独立并且可以自由组合的成分。这套语法提出来之后他自己也做了一套软件，但显然这套软件没有被广泛采用；幸运的是，Hadley Wickham在R语言中把这套想法巧妙地实现了。

为了说明这种语法的想法，我们考虑图形中的一个成分：坐标系。常见的坐标系有两种：笛卡尔坐标系和极坐标系。在语法中，它们属于一个成分，可自由拆卸替换。笛卡尔坐标系下的条形图实际上可以对应极坐标系下的饼图，因为条形图的高可以对应饼图的角度，本质上没什么区别。因此在ggplot2中，从一幅条形图过渡到饼图，只需要加极少量的代码，把坐标系换一下就可以了。如果我们用纸笔模型，则可以想象，这完全是不同的两幅图，一幅图里面要画的是矩形，另一幅图要画扇形。

更多的细节在本书中会介绍，这里我们只是简略说明用语法画图对用纸笔画图来说在思维上的优越性；前者是说话，后者是说字。

发展历程

ggplot2是Hadley在爱荷华州立大学博士期间的作品，也是他博士论文的主题之一，实际上ggplot2还有个前身ggplot，但后来废弃了，某种程度上这也是Hadley写软件的特征，熟悉他的人就知道这不是他第一个“2”版本的包了（还有reshape2）。带2的包和原来的包在语法上会有很大的改动，基本上不兼容。尽管如此，他的R代码风格在R社区可谓独树一帜，尤其是他的代码结构很好，可读性很高，ggplot2是R代码抽象的一个杰作。读者若感兴趣，可以在GitHub网站上浏览他的包：https://github.com/hadley。在用法方面，ggplot2也开创了一种奇特而绝妙的语法，那就是加号：一幅图形从背后的设计来说，是若干图形语法的叠加，从外在的代码来看，也是若干R对象的相加。这一点精妙尽管只是ggplot2系统的很小一部分，但我个人认为没有任何程序语言可比拟，它对作为泛型函数的加号的扩展只能用两个字形容：绝了。

至2013年2月26日，ggplot2的邮件列表（http://groups.google.com/group/ggplot2 ）订阅成员已达3394人，邮件总数为15185封，已经成为一个丰富、活跃的用户社区。未来ggplot2的发展也将越来越依赖于用户的贡献，这也是很多开源软件最终的走向。

关于版本更新

原书面世之时，ggplot2的版本号是0.8.3，译者开始翻译此书时是0.9.0版本；该版本较之0.8.3，内部做了一些大改动。此后，ggplot2频繁升级，目前版本号是0.9.3，当然这也给本书的翻译过程带来了相当大的麻烦。因为译者不但要修正原书中大量过时的代码、重新画图，还要修正过时的理念，以及处理数次版本更新的影响。所幸，在翻译过程中，译者得到了本书审校殷腾飞博士、ggplot2开发者Hadley Wickham和Wistong Chang的大力帮助。

如果你是老用户，那么可能需要阅读下面的小节。之后ggplot2有过多次更新，尤其是0.9.0之后，ggplot2的绘图速度和帮助文档有了质的飞跃。关于0.9的更新，读者可以从https://github.com/downloads/hadley/ggplot2/guide-col.pdf下载一份细致的说明文档，但原文档比较长，而且有些内部更新问题我们也不一定需要了解，因此这里给一段概述。

ggplot2的帮助文档大大扩充了，过去头疼的问题之一就是一个函数里面不知道有哪些可能的参数，例如theme()函数，现在已经有了详细说明。

新增图例向导函数guide_legend()和guide_colorbar()，前者可以用来指导图例的排版，例如可以安排图例中元素排为n行m列；后者增强了连续变量图例的展示，例如当我们把颜色映射到一个连续变量上时，过去生成的图例是离散的，现在可以用这个函数生成连续颜色的图例（渐变色）。

新增几何对象函数geom_map()（让地图语法变得更简单），geom_raster()（更高效的geom_tile()），geom_dotplot()（一维点图，展示变量密度分布）和geom_violin()（小提琴，实为密度曲线）。

新增统计变换函数stat_summary2d()（在二维网格上计算数据密度），stat_summary_hex()（在六边形“蜂巢”上计算数据密度），stat_bindot()（一维点图密度），stat_ydensity()（密度曲线，用于小提琴图）。

facet_grid()支持X轴和Y轴其中一者可以有自由的刻度（根据数据范围而定），以往要么所有切片使用同样的坐标轴刻度，要么所有都自由。

geom_boxplot()开始支持画箱线图的凹槽（notch），就像R基础图形系统中的boxplot()函数。

新增函数ggmissing()用来展示缺失值的分布，ggorder()按照数据观察顺序先后画折线图，ggstructure()展示数据热图。

另外这次更新涉及到一些函数参数名称的变化，如果旧代码在这个版本中报错说有未使用的参数，那么用户需要再次查看帮助文档，确保输入的参数在函数中存在。在所有这些表面的更新背后，实际上ggplot2很大程度上被重写了，例如开始使用R自带的S3泛型函数设计，以及将过去ggplot2的功能继续模块化为一些独立的包，一个典型的例子就是标度部分的功能被抽象到scales包中，从数据映射到颜色、大小等外观属性可以由这个包直接完成。这种分拆也使得其他开发者可使用过去ggplot2内部的一些功能函数。

0.9.1版本主要解决了0.9.0版本中的一些漏洞。ggplot2在2012年9月4日发布了新的版本0.9.2，其中一些特性和更新有必要提及：

采用了全新的主题（theme）系统，opts()函数已被标记为“不推荐使用”（deprecated），将在未来版本中被取消，取而代之的是theme()函数，主题元素（theme element）由属性列表构成，支持继承，主题之间可以直接进行合并等操作。详情参见wiki页面：https://github.com/wch/ggplot2/wiki/New-theme-system 。

依赖于新的gtable包。用来更方便地调整修改ggplot2图形中的图元，ggplotGrob()会返回一个gtable类，这个对象可以利用gtable包中提供的函数和接口进行操作。

所有“模板”类型的图形函数，比如plotmatrix()，ggorder()等等，已被标记为“不推荐使用”（deprecated），将在未来版本中取消。

在本书出版之际，ggplot2更新到了版本0.9.3，修复了0.9.2的一些漏洞，其主要更新包括

不再支持plotmatrix()函数。

geom_polygon()提速，比如世界地图的绘制快了12倍左右。

新增部分主题，比如theme_minimal()，theme_classic()。

本书的所有代码和图片都是针对新版本0.9.3的，在内容方面也根据版本更新对原文做了适当的增删填补，以满足读者的需求。

本书把影响正文阅读的彩图集中放在附录后面，读者可以随时翻阅。

致谢

在听说我们翻译完这本书之后，本书原著Hadley很高兴，给我们发邮件说：

I am excited and honoured to have my book translated to Chinese. ggplot2 has become far more popular than I ever imagined, and I'm excited that this translation will allow many more people to learn ggplot2. I'm very grateful that Yihui and his team of translators (Nan Xiao, Tao Gao, Yixuan Qiu, Weicheng Zhu, Taiyun Wei and Lanfeng Pan) made this possible.

One of the biggest improvements to ggplot2 since the book was first written is the ggplot2 mailing list. This is a very friendly environment where you can get help with your visualisations, and improve your own knowledge of ggplot2 by helping others solve their problems. I'd strongly encourage you to join the mailing list, even if you think your English is not very good -- we are very friendly people.

我们感谢这本书的译者，包括邱怡轩（第1~2章）、主伟呈（第3~4章）、肖楠（第5~6章）、高涛（第7~8章）、潘岚锋（第9章）、魏太云（第10章、附录以及翻译过程的协调安排和全书的LaTeX排版工作）。所有译者均来自于统计之都（http://cos.name ）。

爱荷华州立大学的殷腾飞博士、中国人民大学统计学院的孟生旺教授、浙江大学的张政同学通读了译稿，提出了很多有用的建议，殷腾飞博士还提供了大多数新版本中的解决方案，并担任本书的审校。肖凯老师和余光创博士分别对第1~4章、第8~10章以及附录提出了很多修改意见，此外，中国人民大学的陈妍、李晓矛、谢漫锜三位同学、中国再保险公司的李皞先生、百度公司的韩帅先生、eBay公司的陈丽云女士、Mango Solutions公司的李舰先生、京东商城的刘思喆先生、首钢总公司的邓一硕先生、新华社的陈堰平先生在此书的翻译过程中也曾提过不少宝贵的建议，在此一并表示感谢。

为了更好地服务社区，我们还建立了翻译主页：https://github.com/cosname/ggplot2-translation ，读者可以在这里得到最新的勘误和书中的代码，也可以随时提出任何问题。

谢益辉

2013年2月26日

《数据思维与可视化探险：洞悉信息洪流的导航指南》在这个信息爆炸的时代，数据不再是冰冷的数字，而是隐藏着无限可能性的宝藏。然而，如何从浩如烟海的数据中挖掘出有价值的洞见，并将其清晰、有效地传达给他人，却是一项充满挑战的任务。本书并非关于某个特定工具的使用教程，而是旨在引领您踏上一场“数据思维”的探险之旅，学习如何像一位经验丰富的探险家一样，解读数据背后的故事，并运用直观、富有表现力的可视化手段，将这些故事生动地呈现出来。第一部分：拨开迷雾，重塑数据认知在数据分析的旅程中，我们首先需要具备一套科学的“数据思维”。这不仅仅是掌握统计学公式或编程语言，更重要的是理解数据产生的逻辑，认识数据的局限性，以及如何以批判性的眼光审视它们。数据的本质与生命周期：我们将深入探讨数据的起源，了解不同类型的数据（结构化、半结构化、非结构化）的特点，以及数据从采集、清洗、存储、处理到最终呈现的完整生命周期。理解数据是如何被创造和塑造的，是后续一切分析工作的基础。例如，我们将讨论传感器收集的实时数据与调查问卷收集的离散数据的差异，以及它们在分析时应采取的不同策略。问题的定义与数据的关联：任何数据分析都始于一个明确的问题。本书将引导您学习如何将现实世界的问题转化为可量化的数据分析目标。这需要我们学会提炼核心问题，识别与问题相关的关键变量，并理解现有数据是否能够有效支撑这些问题的解答。我们将通过案例分析，展示如何从模糊的商业需求出发，逐步细化出具体的数据分析问题，例如“为什么某个产品的销售额在特定时期出现下滑？”——这个笼统的问题需要分解为“用户在哪个环节流失？”，“竞争对手是否有新动作？”，“营销策略是否需要调整？”等更具体的问题，并思考需要收集哪些数据来回答这些问题。数据质量的“筛石取金”：垃圾进，垃圾出。数据质量是分析结果可靠性的基石。我们将学习如何识别和处理数据中的缺失值、异常值、重复值以及不一致性。这不仅仅是简单的删除或填充，而是需要结合业务逻辑，审慎判断处理方式，并理解不同处理方法可能对分析结果带来的潜在影响。例如，对于用户年龄的缺失值，是直接删除该用户记录，还是根据其他信息进行估算？估算的方法又有哪些，各自的优劣是什么？统计学的“透视镜”：统计学是理解数据规律的重要工具。本书将为您揭示常用的统计概念，如描述性统计（均值、中位数、标准差等）如何帮助我们概括数据的基本特征，推断性统计（假设检验、置信区间等）如何帮助我们从样本推断总体。我们不会深陷复杂的数学推导，而是侧重于理解这些统计方法背后的逻辑和应用场景，以及如何避免常见的统计误区。例如，理解“相关不等于因果”对于避免错误的结论至关重要。第二部分：可视化艺术，解锁数据的沟通语言将复杂的数据转化为直观易懂的可视化图形，是数据分析师的核心技能之一。好的可视化不仅能清晰地展示数据，更能激发观众的思考，推动决策。可视化的基本原则与心理学：为什么有些图表一眼就能看懂，而有些则令人费解？本书将深入探讨可视化设计的核心原则，包括清晰性、准确性、有效性和美观性。我们将结合认知心理学，理解人类如何感知颜色、形状、大小和位置，以及如何利用这些原理来设计更具影响力的图表。例如，为什么红色通常表示警告，而蓝色则常用于平静的场景？理解这些，有助于我们更有效地选择颜色方案。图表类型的“万花筒”：散点图、折线图、柱状图、饼图、箱线图…… 每种图表都有其最适合表达的数据关系和信息类型。本书将详细介绍各种常用图表的适用场景、优缺点，以及如何根据想要传达的信息来选择最合适的图表类型。我们将不仅仅是列举图表，更会剖析“为什么”选择这个图表，以及“如何”通过调整图表元素（如坐标轴、标签、颜色、标记）来优化表达效果。例如，当需要展示趋势随时间的变化时，折线图是首选；而当需要比较不同类别之间的数值大小时，柱状图则更为合适。 “讲故事”的可视化叙事：最好的可视化能够讲述一个引人入胜的故事。本书将引导您学习如何通过一系列精心设计的图表，构建一个清晰的故事线，引导观众一步步理解数据背后的洞察。我们将探讨如何通过图表的顺序、强调关键信息、以及使用恰当的标题和注释来增强叙事性。例如，一个关于市场份额变化的分析，可以从展示整体市场增长开始，然后分解到不同竞争对手的份额变化，再深入分析影响市场份额变化的关键因素，最终提出 actionable insights。高级可视化技巧与互动探索：除了基础图表，我们还将触及一些更高级的可视化技术，例如地理空间可视化、网络图、热力图等，以及如何利用交互式图表允许用户自行探索数据。了解如何利用工具创建带有悬停提示、缩放、过滤等功能的交互式图表，能够极大地提升用户体验和数据的可探索性。避免“数据误导”的陷阱：可视化并非万能，不当的使用可能导致信息的扭曲甚至误导。本书将重点讲解在可视化过程中需要警惕的陷阱，例如不当的坐标轴设置、欺骗性的颜色使用、以及过度复杂的图表设计。学会识别和避免这些陷阱，是成为一个负责任的数据沟通者的重要一步。第三部分：实践出真知，构建你的数据洞察力理论学习最终需要转化为实践。本书将通过大量的案例研究和思考题，鼓励您将所学知识应用于实际场景。案例分析：从实际问题出发：我们将剖析来自不同领域（商业、科学、社会科学等）的真实数据分析案例。从数据的收集和理解，到分析方法的选择和应用，再到可视化呈现的每一个步骤，都将进行详细的解读。您将看到，如何将抽象的数据思维和可视化原则，转化为解决实际问题的有力工具。动手练习与反馈：书中将提供一系列由易到难的练习，引导您独立思考和操作。这些练习旨在巩固您对数据思维和可视化技术的理解，并鼓励您尝试不同的分析和可视化方法。构建你的“数据武器库”：本书并非提供一套“银弹”式的解决方案，而是为您构建一个强大的“数据武器库”。通过理解不同的分析方法和可视化技巧的原理和适用性，您可以根据具体的数据和问题，灵活地选择最适合的工具和方法。《数据思维与可视化探险：洞悉信息洪流的导航指南》将帮助您摆脱对数据的迷茫，掌握驾驭信息洪流的关键技能。无论您是初入数据领域的新手，还是希望提升数据分析和沟通能力的资深人士，都能在这场探险中收获满满，成为一个真正意义上的“数据探索者”和“信息讲述者”。

作者简介

Hadley Wickham，RStudio首席科学家，美国莱斯大学统计学助理教授，毕业于爱荷华州立大学统计系。Hadley是R社区最活跃的人之一，代码风格独树一帜，致力于开发用于数据处理、分析、成像的工具，截至2012年已经开发了超过30个高质量的R软件包，比如ggplot2, lubridate,plyr, reshape2, stringr, httr等。

目录信息

1.简介
2.从qplot开始入门
3.语法突破
4. 用图层构建图像
5.工具箱
6. 标度、坐标轴和图例
7.定位
8. 精雕细琢
9. 数据操作
10．减少重复性工作
附录A 不同语法间的转换
附录B 图形属性的定义
附录C 用grid操作图形
· · · · · · (收起)

读后感

评分☆☆☆☆☆

用户评价

评分☆☆☆☆☆

这本书的封面设计非常吸引人，色彩搭配和谐，那种深邃的蓝色调让人联想到数据海洋中的无限可能。我原本是抱着试试看的心态翻开的，因为我对数据可视化的热情一直很高，但总觉得现有工具的学习曲线太过陡峭。拿到手里，首先映入眼帘的是那种纸张的质感，厚实而富有韧性，翻阅起来非常舒服，没有廉价印刷品的粗糙感。更重要的是，排版布局清晰明了，即便是初次接触复杂图表代码的读者，也能很快找到重点。作者在引言部分对数据美学和统计图形的哲学进行了深入浅出的探讨，这让我意识到，这本书不仅仅是一本“工具书”，更像是一本“思想启迪录”。它没有急于抛出复杂的函数，而是先构建了一个坚实的概念框架，引导读者去思考“为什么我们要这样画图”，而不是仅仅停留在“如何画出这个图”。这种循序渐进的教学方式，极大地降低了我的心理门槛，让我从一开始就建立起了对这门技艺的敬畏与热情。整本书的氛围是沉静而充满力量的，似乎每页都在低语着关于数据清晰表达的秘密。

评分☆☆☆☆☆

如果要用一个词来概括阅读这本书后的感受，那一定是“解放”。在接触它之前，我总觉得数据可视化是一个充满妥协的领域——要么牺牲美观换取清晰度，要么牺牲效率换来惊艳的效果。这本书彻底打破了这种二元对立。它教会我，美学和严谨性是可以完美融合的。阅读过程中，我被书中那些通过极简主义设计所呈现出的强大洞察力深深震撼。那些看似简单的条形图或散点图，经过精妙的色彩和坐标轴处理后，传达出的信息量是爆炸性的。这本书不仅仅是教你如何操作一个软件库，它是在重塑你对“信息传达”这件事的认知。它让你明白，每一次像素点的移动，每一次图层堆叠，都蕴含着沟通的意图。现在，当我面对新的数据挑战时，我不再感到迷茫，因为我已经有了一套系统化的、基于美学原则的数据叙事工具箱。这绝对是一部值得反复翻阅，并在实践中不断领悟的经典之作。

评分☆☆☆☆☆

这本书的叙事节奏把握得非常精妙，它仿佛一位经验老到的导师，知道何时该加快步伐，何时该放慢脚步进行深度剖析。初期的章节，专注于基础的“层（layer）”的概念搭建，语言流畅自然，很容易让人沉浸其中，仿佛在搭建积木一般有趣。然而，当涉及到更深层次的统计转换和数据重塑时，它的讲解方式发生了微妙的变化。作者开始使用更精确、更具数学严谨性的语言，但同时又不失可读性，通过精心设计的流程图和代码注释来辅助理解那些抽象的计算过程。我记得有一次，我在处理一个多变量时间序列数据时遇到了瓶颈，书里关于“分组与分面（facet）”的章节，用一个非常巧妙的嵌套案例，瞬间解开了我的困惑。这种处理复杂问题的能力，体现了作者深厚的理论功底和丰富的实战经验。它不像某些教程那样“填鸭式”教学，而是引导读者自己去发现规律，从而建立起对底层逻辑的深刻理解。

评分☆☆☆☆☆

我最欣赏这本书的地方，在于它对“细节决定成败”的极致追求。市面上很多技术书籍，要么只关注宏观的框架，要么陷入到对细枝末节的冗余描述中，难以取舍。但这本书却找到了一个绝妙的平衡点。它用大量的篇幅讲解了如何精确控制图表的每一个元素——从坐标轴的刻度疏密，到图例标签的字体大小，再到颜色编码的语义学意义。举个例子，关于“主题（theme）”的定制部分，作者没有简单地罗列所有可用的参数，而是通过对比不同主题如何影响解读效率，来论证定制的必要性。我特别喜欢其中关于“信息墨水比”的讨论，这让我在处理那些信息密度极高的报告时，有了一套明确的优化标准。阅读过程中，我常常需要停下来，对照我自己的项目数据，尝试模仿书中的高级技巧。这种即时的实践反馈，使得学习过程不再是单向的灌输，而是一种双向的探索与打磨。对于希望将数据报告提升到艺术品级别的专业人士来说，这本书提供的不仅仅是技巧，更是一种精益求精的工匠精神。

评分☆☆☆☆☆

这本书的配套资源和示例代码的组织方式，简直是教科书级别的典范。通常情况下，我们购买技术书籍后，最大的痛点就是代码的同步和调试。但这本书在这方面做得无懈可击。每一个代码块都经过了严格的测试和优化，而且作者似乎预料到了读者可能会遇到的各种环境配置问题，在附录中提供了详尽的安装和环境配置指南。更棒的是，作者并没有将所有代码混杂在一起，而是清晰地按照章节的逻辑进行模块化管理，每一个示例都可以独立运行，便于读者进行针对性的学习和调试。我尤其欣赏那些“扩展阅读”和“深入探讨”的小栏目，它们像是隐藏的彩蛋，偶尔会引用一些前沿的研究论文或者更底层的实现细节。这让这本书的价值远远超出了其物理页数，它成为了一个持续学习和深入钻研的知识枢纽，而非一个终点站。这种对学习体验全生命周期的关怀，是许多同类出版物所欠缺的。

评分☆☆☆☆☆

More than just data, It was fulfilled with philosophy and art.

评分☆☆☆☆☆

喜欢这种讲的很系统的书

评分☆☆☆☆☆

温故而知新啊，感谢译者寄来的签名版。

评分☆☆☆☆☆

最重要的告诉了各个数学图的表达的意义。统计图形就是从数据到几何对象（点线条形等）的图形属性（颜色形状大小）的一个映射。图形还包含数据的统计变换绘制在某个特定的坐标系中，而分面（就是条件作图，将绘图串口划分为若干子窗口）则可以用来生成数据不同子集的图形。数据几何对象统计变换标度坐标系几个概念的组合。颜色和形状适合分类变量大小适合连续变量。几何对象描述了应该用何种对象对数据展示其中有些几何对象关联的了相应的统计变换直方图就是分组计数再加上条形的几何对象。具体的图的组成和基本部件高于三维变量作图不可能：或者高维的点映射到平面的图形，或者减少变量降维数到二维平面作图：聚类分析，主成分分析，因子分析。图形对象就是一个包含数据映射图层标度坐标分面的列表

评分☆☆☆☆☆

一直忘记标注，真的太棒了！