Demonstrations of Auditory Scene Analysis pdf epub mobi txt 电子书下载 2026

简体网页||繁体网页

☆☆☆☆☆

出版者:Mit Pr

作者:Bregman, Albert S./ Ahad, Pierre A.

出品人:

页数:0

译者:

出版时间:1996-3

价格:$ 53.11

装帧:HRD

isbn号码:9780262522212

丛书系列:

图书标签:

听觉场景分析
听觉感知
认知科学
心理声学
信号处理
模式识别
机器学习
神经科学
计算听觉学
声音组织化

下载链接在页面底部

facebook linkedin mastodon messenger pinterest reddit telegram twitter viber vkontakte whatsapp 复制链接

想要找书就要到小美书屋

book.quotespace.org

立刻按 ctrl+D收藏本页

你会得到大惊喜!!

具体描述

This compact disk contains 41 audio illustrations of the principles underlying the human perceptual organization of sound that were first described in Albert Bregman's book, "Auditory Scene Analysis" (MIT Press 1990). The CD can be played on any home CD player; for the most part the audio demonstrations can be listened to over loudspeakers, but a few are in stereo and require headphones. While referring readers to the relevant pages in the book, the CD can be used on its own. Each demonstration is described in the companion 78-page booklet, along with a diagram, an explanation, technical details and suggested readings. There is also a 58-item bibliography. The CD can also provide a set of perceptual phenomena that any computational mode of auditory scene analysis should be able to explain. As such, it can serve as a test bed for theory.

《声景解析的演示》：深入探究听觉世界的结构与感知图书简介本书旨在为研究人员、学生以及对声音感知和认知科学感兴趣的广大读者，提供一个关于“听觉场景分析”（Auditory Scene Analysis, ASA）这一核心领域全面而深入的导览。不同于侧重理论模型的论述，本书的核心价值在于通过一系列精心设计的、具有代表性的“演示”（Demonstrations）来揭示人类大脑如何将复杂的声学输入分解、组织并理解为具有意义的、可分离的听觉对象。听觉场景分析是心理声学和认知神经科学中的一个基石概念，它描述了听者如何从环境中涌入的混合声流中，实时地分离出独立的、可识别的声源（如人声、音乐、交通噪音等）的过程。本书系统地梳理了这一过程的机制、影响因素以及在不同环境下的应用，强调实验观察和可复现的现象作为理解听觉认知的关键路径。第一部分：听觉场景分析的基础构建本书伊始，即奠定了理解ASA的理论框架和实验方法。我们首先界定了“听觉对象”的本质，区别于单纯的物理声源，强调其是认知构建的结果。 1. 听觉分离的基础机制：本章详细阐述了ASA的驱动力——声学特征。我们探讨了声音如何通过其内在属性被初步分组：时域同步性与相干性：分析了声音在时间上如何对齐，以及何时被视为来自同一源头的信号。演示了“启动-保持”（Onset-Fading）的机制，即声音的起止如何影响对象的分离。频谱与音高轮廓：深入讨论了音高、音色（Timbre）和泛音结构在区分不同声源中的决定性作用。通过对不同乐器或人声的频谱快照分析，演示了大脑如何利用这些细微的频谱差异进行分离。空间位置（声源定位）：讨论了双耳线索（如ITD和ILD）如何贡献于听觉对象的空间分离。书中通过模拟特定混响环境下的定位偏差，演示了空间信息在复杂场景中的重叠与解耦。 2. 分离的竞争与整合：我们随后转向了听觉场景的动态性。ASA并非一次性完成的任务，而是一个持续的、受资源限制的过程。本书演示了“听觉分离的竞争”：当两个或多个声源共享相似的特征时，分离难度显著增加。这包括对“交织”（Interleaving）现象的剖析，即快速交替的音高流如何被感知为单一或多重对象，取决于听者对上下文的预期。第二部分：特征导向的分离与上下文影响在掌握了基础特征后，本书聚焦于高级的分离策略，特别是自下而上（特征驱动）和自上而下（认知驱动）过程的相互作用。 3. 掩蔽效应的解析：掩蔽是研究听觉分离的经典范式。本书不仅回顾了经典的频率域和时域掩蔽，更侧重于“对象掩蔽”（Object-based Masking）。演示了当一个复杂声源（掩蔽者）的特征与目标声源（被掩蔽者）的特征存在显著差异时，即使物理能量重叠，听觉分离仍能成功，反之则失败。这突显了听觉系统对“信号质量”而非仅仅是“信号能量”的关注。 4. 认知预期与注意力的角色：这是理解ASA动态性的关键。本书通过一系列认知实验演示，阐明了注意力的引导作用。例如，当听者被明确告知需要追踪特定说话人的声音时，即使背景噪音的复杂度增加，分离性能也会显著提高。我们探讨了“听觉注意聚焦”如何选择性地增强目标信号的特征，并抑制干扰信号的感知整合。模式匹配与“知晓”的力量：深入分析了当目标声音是听者熟悉的旋律、语言或具有特定语义内容时，ASA过程的效率如何得到大幅提升。这证明了长期记忆和语义知识对实时声源分离的强大反馈作用。第三部分：复杂环境与应用场景的挑战本书的后半部分，将理论应用于更贴近真实世界的复杂听觉环境，探讨了人类ASA系统的局限性与适应性。 5. 混响环境下的声景重建：室内声学环境的反射（混响）极大地复杂化了听觉场景。本书详细演示了“回声消除”与“声源分离”如何协同工作。我们分析了早期反射对音色感知的影响，以及大脑如何利用“先声”（First Wave Arrival）来建立初始的对象结构，并对后续的反射进行抑制或整合。特别关注了低信噪比（SNR）下的分离难度，以及听者如何依赖空间信息来穿透强混响。 6. 多说话人场景（Cocktail Party Problem）：作为ASA研究的经典难题，鸡尾酒会问题被细致剖析。本书演示了不同策略如何应对多语音流：分离机制的层级：演示了从语音的基频（F0）分离到词汇识别的完整流程。社交线索的整合：探讨了交谈者的目光接触、面部表情等非听觉线索如何反哺听觉分离，进一步锚定说话人的身份。 7. 人类与技术的分离能力对比：为了更好地评估人类听觉系统的效率，本书提供了一个视角，将人类的ASA表现与当前最先进的盲源分离（Blind Source Separation, BSS）计算模型进行对比。这部分并非侧重于技术细节，而是用实验结果说明，人类系统在处理特征不完整、非线性、高噪声和高上下文依赖性的场景时，所展现出的鲁棒性与灵活性，是当前计算方法仍难以完全企及的领域。总结与展望《声景解析的演示》不仅仅是一本理论综述，它是一份操作指南，引导读者通过对关键现象的观察与理解，构建对听觉世界如何被构造的直观认识。本书强调，听觉场景分析是人类生存和社交互动的基础，理解其机制，对于听力障碍辅助技术、语音交互设计以及神经科学研究都具有深远的意义。全书的演示性结构确保了读者能够清晰地把握从物理刺激到感知对象的完整路径。