Educational Testing and Measurement pdf epub mobi txt 电子书下载 2026

简体网页||繁体网页

☆☆☆☆☆

出版者:

作者:Tom Kubiszyn,Gary D. Borich

出品人:

页数:0

译者:

出版时间:2002-11

价格:730.00元

装帧:

isbn号码:9780471149774

丛书系列:

图书标签:

教育测量
教育统计
心理测量
标准化测试
信度与效度
测量理论
教育评估
考试编制
项目分析
量化研究

下载链接在页面底部

facebook linkedin mastodon messenger pinterest reddit telegram twitter viber vkontakte whatsapp 复制链接

想要找书就要到小美书屋

book.quotespace.org

立刻按 ctrl+D收藏本页

你会得到大惊喜!!

具体描述

变革中的评估：教育测量与未来趋势本书聚焦于现代教育评估领域的深刻变革，深入剖析了从传统测量方法到基于能力的、适应性评估的演进历程。它并非聚焦于单一的教科书名称，而是将视角投向整个教育测量学的宏观图景、核心理论基础、技术应用及其在现实教育系统中所面临的伦理与实践挑战。本书旨在为教育研究人员、课程设计者、政策制定者以及一线教育工作者提供一个全面且批判性的框架，以理解评估的本质、工具的设计与有效性，以及评估结果如何真正驱动学习改进和公平发展。第一部分：评估的理论基石与历史演进第一章：评估的哲学基础与定义本章首先界定了“测量”与“评估”的区别与联系，探讨了评估在教育系统中的核心功能——不仅仅是分级，更是诊断、反馈和决策支持。我们追溯了心理测量学（Psychometrics）的早期奠基工作，重点分析了有效性（Validity）和可靠性（Reliability）作为任何科学测量系统的双支柱理论框架。特别地，本书详细考察了信效度的主要理论范式，包括内容效度、结构效度（如通过因子分析验证构建）、以及标准关联效度。评估的目的不再是单一的“测量一个固定不变的实体”，而是被置于一个不断变化的、社会建构的背景下进行审视。第二章：测量理论的范式转变：经典测量理论（CTT）到项目反应理论（IRT）经典测量理论（CTT）作为传统考试设计的基石，其局限性（如试题分数依赖于测试样本、测量误差难以分离）被详尽分析。在此基础上，本书将重点介绍现代项目反应理论（IRT）的革命性贡献。IRT如何实现项目参数与受试者能力的独立估计、如何支持更高效的测试构建（如计算机自适应测试CAT），以及它在大型标准化考试设计中的关键作用。通过案例研究，读者将理解如何应用更精细的数学模型来提高评估的精度和效率。第三章：教育评估的历史脉络与社会责任评估的实践从未脱离社会和政治背景。本章梳理了从二十世纪初的智力测验运动，到二战后的标准化成就测试的兴起，再到当代对高风险考试（High-Stakes Testing）的社会反思。重点讨论了评估在促进或阻碍教育公平方面的双重作用。评估的设计必须正视其嵌入的文化偏见和潜在的社会后果。第二部分：评估的设计、实施与分析技术第四章：构建高质量的评估工具：从规范到标准高质量的评估工具必须与教学目标紧密对齐。本章详细阐述了如何进行有效的内容抽样和编制蓝图（Test Blueprinting）。我们深入研究了形成性（Formative）和总结性（Summative）评估的不同设计要求，并着重讨论了绩效评估（Performance Assessment）——如作品集（Portfolios）和真实情境任务（Authentic Tasks）——的设计原则和评分方案（Rubrics）的构建艺术。第五章：信效度的深入探讨与测量误差管理本章超越了基础的信效度定义，探讨了在复杂教育环境中估计和报告测量误差的先进方法。内容包括：如何使用通用差分理论（G-Theory）来分析多重误差源（如评分者、项目集合、情境因素），以及如何报告评估结果的“可信区间”，而非单一分数点。此外，本章也探讨了适应性测试环境下，如何维护跨情境评估的等值性（Equating）。第六章：数据驱动的决策：统计分析在评估中的应用现代评估产生海量数据，本章侧重于如何利用这些数据进行有意义的分析。除了描述性统计外，重点介绍了：区分度与难度分析：如何利用项目统计信息优化试题库。效度证据的量化：结构方程模型（SEM）在检验复杂假设模型中的应用。测试等值（Equating）：确保不同版本的测试在衡量同一潜在特质时具有可比性。测试的公平性审查（Differential Item Functioning, DIF）：利用统计技术识别并修正可能对特定群体产生偏见的试题。第三部分：新兴评估范式与未来方向第七章：计算机化与自适应测试（CAT）互联网技术彻底改变了评估的交付方式。本章详细解析了计算机自适应测试（CAT）的工作原理，包括项目池管理、项目选择算法（如最大信息量准则）以及实时估计受试者能力的动态过程。同时，本书也探讨了CAT在确保安全性和提高测试效率方面的优势与挑战。第八章：基于能力的评估与学习进程的测量教育理念正转向强调学生“能做什么”，而非“知道多少”。本章探讨了基于能力的评估（Competency-Based Assessment）的理论框架，及其对传统分数概念的挑战。重点关注了学习进程测量（Progressive Measurement）——如何设计评估来追踪和描绘学习者在特定技能领域的细微进步轨迹，而非仅仅提供一个终点分数。第九章：评估的伦理、问责制与政策影响评估结果往往直接关系到资源分配、教师评价乃至学校存废。本章深入探讨了评估问责制（Accountability）体系的构建与风险。核心议题包括：分数误用（Misuse of Scores）：讨论当评估结果被用于超出其设计目的的决策时所引发的伦理困境。评估的透明度与公众理解：如何向非专业人士清晰传达测试的局限性和结果的意义。未来挑战：面对人工智能和大数据时代的挑战，评估系统如何适应新的学习模式和新的知识形态。本书通过理论深度、技术细节和现实案例的结合，为读者构建了一个关于教育评估如何服务于更优质、更公平的学习体验的全面认知图景。它鼓励读者超越简单的分数解读，去理解每一次评估背后的测量逻辑、理论假设及其深远的社会影响。