Educational Testing and Measurement

Educational Testing and Measurement pdf epub mobi txt 电子书 下载 2026

出版者:
作者:Tom Kubiszyn,Gary D. Borich
出品人:
页数:0
译者:
出版时间:2002-11
价格:730.00元
装帧:
isbn号码:9780471149774
丛书系列:
图书标签:
  • 教育测量
  • 教育统计
  • 心理测量
  • 标准化测试
  • 信度与效度
  • 测量理论
  • 教育评估
  • 考试编制
  • 项目分析
  • 量化研究
想要找书就要到 小美书屋
立刻按 ctrl+D收藏本页
你会得到大惊喜!!

具体描述

变革中的评估:教育测量与未来趋势 本书聚焦于现代教育评估领域的深刻变革,深入剖析了从传统测量方法到基于能力的、适应性评估的演进历程。 它并非聚焦于单一的教科书名称,而是将视角投向整个教育测量学的宏观图景、核心理论基础、技术应用及其在现实教育系统中所面临的伦理与实践挑战。 本书旨在为教育研究人员、课程设计者、政策制定者以及一线教育工作者提供一个全面且批判性的框架,以理解评估的本质、工具的设计与有效性,以及评估结果如何真正驱动学习改进和公平发展。 第一部分:评估的理论基石与历史演进 第一章:评估的哲学基础与定义 本章首先界定了“测量”与“评估”的区别与联系,探讨了评估在教育系统中的核心功能——不仅仅是分级,更是诊断、反馈和决策支持。我们追溯了心理测量学(Psychometrics)的早期奠基工作,重点分析了有效性(Validity)和可靠性(Reliability)作为任何科学测量系统的双支柱理论框架。特别地,本书详细考察了信效度的主要理论范式,包括内容效度、结构效度(如通过因子分析验证构建)、以及标准关联效度。评估的目的不再是单一的“测量一个固定不变的实体”,而是被置于一个不断变化的、社会建构的背景下进行审视。 第二章:测量理论的范式转变:经典测量理论(CTT)到项目反应理论(IRT) 经典测量理论(CTT)作为传统考试设计的基石,其局限性(如试题分数依赖于测试样本、测量误差难以分离)被详尽分析。在此基础上,本书将重点介绍现代项目反应理论(IRT)的革命性贡献。IRT如何实现项目参数与受试者能力的独立估计、如何支持更高效的测试构建(如计算机自适应测试CAT),以及它在大型标准化考试设计中的关键作用。通过案例研究,读者将理解如何应用更精细的数学模型来提高评估的精度和效率。 第三章:教育评估的历史脉络与社会责任 评估的实践从未脱离社会和政治背景。本章梳理了从二十世纪初的智力测验运动,到二战后的标准化成就测试的兴起,再到当代对高风险考试(High-Stakes Testing)的社会反思。重点讨论了评估在促进或阻碍教育公平方面的双重作用。评估的设计必须正视其嵌入的文化偏见和潜在的社会后果。 第二部分:评估的设计、实施与分析技术 第四章:构建高质量的评估工具:从规范到标准 高质量的评估工具必须与教学目标紧密对齐。本章详细阐述了如何进行有效的内容抽样和编制蓝图(Test Blueprinting)。我们深入研究了形成性(Formative)和总结性(Summative)评估的不同设计要求,并着重讨论了绩效评估(Performance Assessment)——如作品集(Portfolios)和真实情境任务(Authentic Tasks)——的设计原则和评分方案(Rubrics)的构建艺术。 第五章:信效度的深入探讨与测量误差管理 本章超越了基础的信效度定义,探讨了在复杂教育环境中估计和报告测量误差的先进方法。内容包括:如何使用通用差分理论(G-Theory)来分析多重误差源(如评分者、项目集合、情境因素),以及如何报告评估结果的“可信区间”,而非单一分数点。此外,本章也探讨了适应性测试环境下,如何维护跨情境评估的等值性(Equating)。 第六章:数据驱动的决策:统计分析在评估中的应用 现代评估产生海量数据,本章侧重于如何利用这些数据进行有意义的分析。除了描述性统计外,重点介绍了: 区分度与难度分析: 如何利用项目统计信息优化试题库。 效度证据的量化: 结构方程模型(SEM)在检验复杂假设模型中的应用。 测试等值(Equating): 确保不同版本的测试在衡量同一潜在特质时具有可比性。 测试的公平性审查(Differential Item Functioning, DIF): 利用统计技术识别并修正可能对特定群体产生偏见的试题。 第三部分:新兴评估范式与未来方向 第七章:计算机化与自适应测试(CAT) 互联网技术彻底改变了评估的交付方式。本章详细解析了计算机自适应测试(CAT)的工作原理,包括项目池管理、项目选择算法(如最大信息量准则)以及实时估计受试者能力的动态过程。同时,本书也探讨了CAT在确保安全性和提高测试效率方面的优势与挑战。 第八章:基于能力的评估与学习进程的测量 教育理念正转向强调学生“能做什么”,而非“知道多少”。本章探讨了基于能力的评估(Competency-Based Assessment)的理论框架,及其对传统分数概念的挑战。重点关注了学习进程测量(Progressive Measurement)——如何设计评估来追踪和描绘学习者在特定技能领域的细微进步轨迹,而非仅仅提供一个终点分数。 第九章:评估的伦理、问责制与政策影响 评估结果往往直接关系到资源分配、教师评价乃至学校存废。本章深入探讨了评估问责制(Accountability)体系的构建与风险。核心议题包括: 分数误用(Misuse of Scores): 讨论当评估结果被用于超出其设计目的的决策时所引发的伦理困境。 评估的透明度与公众理解: 如何向非专业人士清晰传达测试的局限性和结果的意义。 未来挑战: 面对人工智能和大数据时代的挑战,评估系统如何适应新的学习模式和新的知识形态。 本书通过理论深度、技术细节和现实案例的结合,为读者构建了一个关于教育评估如何服务于更优质、更公平的学习体验的全面认知图景。它鼓励读者超越简单的分数解读,去理解每一次评估背后的测量逻辑、理论假设及其深远的社会影响。

作者简介

目录信息

读后感

评分

评分

评分

评分

评分

用户评价

评分

评分

评分

评分

评分

本站所有内容均为互联网搜索引擎提供的公开搜索信息,本站不存储任何数据与内容,任何内容与数据均与本站无关,如有需要请联系相关搜索引擎包括但不限于百度google,bing,sogou

© 2026 book.quotespace.org All Rights Reserved. 小美书屋 版权所有