Content Evaluation of Textual Cd-Rom and Web Databases pdf epub mobi txt 电子书下载 2026

简体网页||繁体网页

☆☆☆☆☆

出版者:

作者:Jacso, Peter/ Tenopir, Carol (EDT)/ Tenopir, Carol

出品人:

页数:0

译者:

出版时间:

价格:42

装帧:

isbn号码:9781563087370

丛书系列:

图书标签:

信息检索
数据库评估
文本数据库
CD-ROM
Web数据库
内容评估
信息科学
图书馆学
数字图书馆
评估方法

下载链接在页面底部

facebook linkedin mastodon messenger pinterest reddit telegram twitter viber vkontakte whatsapp 复制链接

想要找书就要到小美书屋

book.quotespace.org

立刻按 ctrl+D收藏本页

你会得到大惊喜!!

具体描述

《数字人文的未来：文本、图像与多模态数据的新范式》内容简介本书深入探讨了数字人文研究领域中，文本、图像及多模态数据处理与分析的前沿方法与未来发展方向。在信息爆炸的时代，如何有效地从海量的数字资源中提取知识、构建意义，并将其转化为具有洞察力的研究成果，是摆在所有数字人文工作者面前的核心挑战。本书旨在提供一个全面、系统且极具操作性的框架，指导研究者超越传统的数据集范畴，构建面向未来的研究范式。全书共分为六个主要部分，从理论基础到尖端应用，层层递进，确保读者能够建立起坚实的理论支撑和实用的技术能力。 --- 第一部分：数字人文研究的基础重构本部分首先梳理了数字人文研究自诞生以来的演变脉络，重点分析了当前研究范式面临的局限性，特别是在处理非结构化、异构性数据时的困境。我们强调，传统的“文本”概念已不再局限于纯粹的印刷体字符，而是扩展到包括扫描图像的底层像素、富文本标记、时间序列数据以及感知数据。章节 1：超越印刷体：数字对象的本体论转变。探讨了数字档案的物理性缺失如何重塑我们对“文献”和“语料库”的理解。引入了“数字制品（Digital Artifact）”的概念，强调其生成、存储和再现过程对意义构建的深刻影响。章节 2：语料库的构建与伦理考量。详细讨论了大规模语料库（Corpus）的采集、清洗与标注流程。着重分析了版权、数据隐私以及数据偏差（Bias）对研究结果的潜在误导，提出建立“负责任的数据集”的构建原则。 --- 第二部分：文本深度挖掘与语义模型的演进本部分聚焦于如何从海量的数字化文本中提取深层语义信息，并探讨了从经典统计方法到现代深度学习模型的转型。章节 3：主题模型（Topic Modeling）的精细化应用。不仅仅停留在Latent Dirichlet Allocation (LDA) 的基础介绍，而是深入探讨了动态主题模型（Dynamic Topic Models）在追踪历史语境变化中的应用，以及如何通过解释性主题模型（Interpretable Topic Models）弥合量化分析与人文洞察之间的鸿沟。章节 4：词嵌入（Word Embeddings）的高级解读。分析了Word2Vec、GloVe等经典模型，并重点阐述了BERT、GPT等Transformer架构模型在捕捉复杂上下文关系上的革命性突破。讨论了如何利用这些模型进行词义漂移（Semantic Shift）分析，以及在小语料或低资源语言中应用预训练模型的策略。章节 5：关系抽取与知识图谱的构建。介绍了从非结构化文本中自动化识别实体（Entities）、关系（Relations）和事件（Events）的技术路径。详细阐述了如何将抽取出的信息转化为可查询、可可视化的知识图谱，以支持复杂历史网络的重构。 --- 第三部分：图像与视觉数据的计算分析随着数字化项目越来越多地涵盖手稿、地图、艺术品和摄影作品，计算图像分析在数字人文中的地位日益重要。本部分专门探讨了处理视觉信息的方法。章节 6：文档图像分析（Document Image Analysis, DIA）的前沿技术。涵盖了从光学字符识别（OCR）到版面分析（Layout Analysis）的完整流程。特别关注了对历史文献、手写体（HMEI）和混合文本（文本与插图并存）的鲁棒识别技术。章节 7：深度学习在艺术史与建筑研究中的应用。介绍了卷积神经网络（CNNs）在风格识别、内容分类和图像检索中的应用。探讨了如何利用迁移学习技术，训练模型来识别特定历史时期或地域的视觉特征，例如纹理、构图和符号学元素。章节 8：空间数据与地理信息系统（GIS）的整合。讨论了如何将历史地图、旅行日记中的地名信息，通过地理编码（Geocoding）技术整合到GIS平台中，实现对历史空间模式的量化分析。 --- 第四部分：多模态融合与跨模态推理现代研究越来越倾向于整合文本、图像、音频甚至传感器数据。本部分是本书的核心，着重于如何实现不同类型数据的有效“对话”。章节 9：多模态数据的对齐与同步。探讨了在时间序列数据（如电影、录音或带注释的数字展览）中，如何精确对齐文本描述与相应的视觉或听觉事件。介绍了跨模态注意力机制在解决“哪个词对应哪张图”问题上的作用。章节 10：跨模态检索与生成。展示了如何训练模型实现“以图搜文”和“以文搜图”。更进一步，探讨了生成模型（如Diffusion Models或GANs）在辅助历史重建或生成“缺失”的视觉叙事方面的潜力与局限。 --- 第五部分：研究成果的交互与可视化呈现计算分析的最终目的是服务于人文洞察的传播。本部分关注如何将复杂的计算结果转化为直观、可探索的交互式媒介。章节 11：叙事可视化（Narrative Visualization）的设计原则。区分了探索性可视化和解释性可视化。提供了基于D3.js、Vega-Lite等库构建复杂关系网络、时间轴和地理空间分布图的最佳实践。章节 12：交互式数字展览与“数据故事”。讨论了如何设计用户体验（UX）驱动的数字平台，使用户能够“亲手操作”数据，检验研究者的假设。案例分析涵盖了互动式手稿阅读器和动态知识图谱探索工具。 --- 第六部分：面向可持续性的计算实践本部分着眼于研究的长期价值和环境影响。章节 13：研究的可重复性与开放科学（Open Science）。详细介绍了如何使用容器化技术（如Docker）和代码库（如GitHub/GitLab）来确保计算流程的透明性和可复现性。讨论了 FAIR 原则（Findable, Accessible, Interoperable, Reusable）在数字人文研究中的具体实施路径。章节 14：计算资源的能效与长期存档。探讨了大规模模型训练和数据存储所涉及的能耗问题，并提出了在追求先进计算能力的同时，如何平衡研究可持续性和环境责任的策略。目标读者：本书面向对前沿计算技术感兴趣的人文社科研究人员、图书馆和档案馆的专业人员、计算机科学中对应用领域有兴趣的研究生及博士后，以及所有致力于探索下一代数字研究方法的学者。本书不仅仅是一本技术手册，更是一份对未来数字人文研究视野的深邃展望。它要求读者拥抱跨学科思维，将严谨的计算方法与深厚的人文关怀相结合，共同塑造知识生产的新疆域。