Multiple Imputation for Nonresponse in Surveys pdf epub mobi txt 电子书下载 2026

简体网页||繁体网页

☆☆☆☆☆

出版者:Wiley-Interscience

作者:Donald B. Rubin

出品人:

页数:258

译者:

出版时间:2004-6-9

价格:USD 158.00

装帧:Paperback

isbn号码:9780471655749

丛书系列:

图书标签:

1
0
Multiple Imputation
Survey Methodology
Nonresponse
Missing Data
Statistical Inference
Data Analysis
Quantitative Research
Longitudinal Data
Causal Inference
Bayesian Methods

下载链接在页面底部

facebook linkedin mastodon messenger pinterest reddit telegram twitter viber vkontakte whatsapp 复制链接

想要找书就要到小美书屋

book.quotespace.org

立刻按 ctrl+D收藏本页

你会得到大惊喜!!

具体描述

Demonstrates how nonresponse in sample surveys and censuses can be handled by replacing each missing value with two or more multiple imputations. Clearly illustrates the advantages of modern computing to such handle surveys, and demonstrates the benefit of this statistical technique for researchers who must analyze them. Also presents the background for Bayesian and frequentist theory. After establishing that only standard complete--data methods are needed to analyze a multiply--imputed set, the text evaluates procedures in general circumstances, outlining specific procedures for creating imputations in both the ignorable and nonignorable cases. Examples and exercises reinforce ideas, and the interplay of Bayesian and frequentist ideas presents a unified picture of modern statistics.

《调查数据中的缺失值处理：理论与实践》图书简介本书系统深入地探讨了调查研究中普遍存在的缺失数据问题，并全面介绍了处理这些缺失值的各种统计方法和实际操作指南。在现代社会科学、市场研究、公共卫生以及经济学调查中，数据缺失是一个难以回避的挑战。如果处理不当，缺失值可能导致估计量偏差、统计功效降低，甚至得出误导性的结论。本书旨在为研究人员、统计学家和数据分析师提供一个坚实的基础，使其能够理解缺失机制，选择合适的分析策略，并有效实施先进的缺失值处理技术。第一部分：缺失数据的基础与机制本书首先奠定了对缺失数据理论的理解基础。我们详细解释了缺失数据发生的机制，这是选择正确处理方法的先决条件。我们将缺失机制分为三大类： 1. 完全随机缺失（Missing Completely At Random, MCAR）：缺失的发生与任何可观测或不可观测的变量都无关。 2. 随机缺失（Missing At Random, MAR）：缺失的发生依赖于已观测到的数据，但与缺失值本身的大小无关。 3. 非随机缺失（Not Missing At Random, NMAR）：缺失的发生依赖于未观测到的数据本身。每种机制的识别方法、对传统分析方法的潜在影响，以及如何通过数据结构和先验知识进行初步判断，都在本部分得到了详尽的阐述。我们通过大量的案例分析，展示了如果不正确地识别机制而采取简单方法（如删除）可能带来的严重后果。随后，本书对传统的、简单的数据补全方法进行了批判性评估。这包括：列表删除法（Listwise Deletion）：解释了该方法在MCAR下的有效性边界及其在MAR或NMAR下导致的偏差和信息损失。成对删除法（Pairwise Deletion）：讨论了其在相关性估计中的应用局限性和可能出现的协方差矩阵非正定问题。均值/中位数/众数替换法（Mean/Median/Mode Imputation）：深入分析了这类“热插值”方法的固有缺陷，例如低估标准误、扭曲变量分布、以及对变量间关系估计的偏差。第二部分：经典与现代的插补技术本书的核心章节聚焦于先进的数据插补技术。我们不仅涵盖了被广泛应用的经典方法，还详细介绍了近年来发展起来的更具鲁棒性的现代技术。经典插补方法（单值插补的改进）：回归法插补（Regression Imputation）：探讨了如何利用线性、逻辑斯谛等回归模型来预测缺失值。重点讨论了如何通过添加残差项来模拟随机性，但同时也指出这种方法仍会低估标准误差的问题。随机回归法插补（Random Regression Imputation）：作为对简单回归法的改进，介绍了如何引入随机误差项以更好地反映真实数据的变异性。现代插补方法（基于模型的稳健方法）：本书投入了大量篇幅介绍基于概率模型的方法，这些方法能够更真实地反映不确定性，并提供有效的标准误估计。期望最大化（Expectation-Maximization, EM）算法：详细讲解了EM算法在处理缺失数据时的迭代框架，特别是针对正态分布数据和结构方程模型下的应用。讨论了其收敛特性和在MAR条件下的渐近有效性。多重插补（Multiple Imputation, MI）的理论基础：这是本书的重点之一。我们从贝叶斯统计的视角阐述了多重插补的原理，即生成$M$个合理的数据集，对每个数据集进行分析，然后综合结果。详细介绍了Rubin的组合规则（Rubin's Rules），用于正确地合并来自不同插补数据集的估计量和标准误。多重插补的实现技术：深入讲解了用于生成高质量插补值的具体算法，包括： MCMC（Markov Chain Monte Carlo）方法：特别是在处理高维数据和复杂模型时的应用。联合分布法（Joint Modeling）：如何为所有缺失变量构建联合分布模型并进行抽样。贝叶斯回归插补（Bayesian Regression Imputation）：在MAR假设下，利用后验预测分布进行插补。第三部分：特定情境下的高级处理与应用本书延伸至更复杂的数据结构和研究设计中的缺失值处理。处理NMAR的策略：由于NMAR假设下，任何基于MAR的插补方法都可能存在偏差，本书探讨了如何利用可观测信息来构建NMAR模型：选择模型（Selection Models）：如Heckman两阶段模型在处理样本选择偏差时的扩展。模式混合模型（Pattern Mixture Models）：通过为不同的缺失模式构建独立的模型来捕捉NMAR的影响。敏感性分析（Sensitivity Analysis）：介绍如何通过设定不同程度的NMAR假设（例如，使用固定偏移量或协变量依赖的NMAR结构）来评估结果的稳健性。复杂调查设计中的处理：在具有分层、整群抽样和抽样权重的复杂调查数据中，缺失值处理必须与抽样设计兼容。本书讨论了如何将插补与设计权重结合，确保最终估计量保持无偏性，特别是针对多重插补后的权重调整问题。面板数据与纵向数据：对于追踪研究中常见的“时间点缺失”或“退出（Attrition）”问题，本书探讨了特定的插补和分析方法，如广义估计方程（GEE）在处理时间点特定缺失时的局限性，以及如何利用潜在增长模型（LGM）来应对个体水平的变异性。第四部分：软件实现与实践指南本书的实践价值体现在对主流统计软件中缺失值处理功能的详细介绍。我们提供了详尽的步骤指南和代码示例（主要基于R语言环境，同时参考了Stata和SAS中的对应工具）。内容涵盖：使用`mice`、`Amelia`等R包进行多重插补的流程、诊断和结果合并。如何在结构方程建模（SEM）框架下，利用最大似然（ML）或全信息最大似然（FIML）处理缺失数据。如何进行插补模型的诊断，包括检查插补值是否合理、插补模型是否充分捕获了数据结构、以及对多重插补结果的收敛性检验。通过本书的学习，读者将不仅掌握处理缺失数据的统计原理，还能自信地在实际研究中应用最适合其数据特点和研究问题的先进技术，从而产出更准确、更可靠的调查分析结果。