Text Encoding Initiative

Text Encoding Initiative pdf epub mobi txt 电子书 下载 2026

出版者:
作者:Ide, Nancy; Veronis, Jean; Va(c)Ronis, Jean
出品人:
页数:246
译者:
出版时间:1995-10
价格:$ 202.27
装帧:
isbn号码:9780792337041
丛书系列:
图书标签:
  • 出版
  • Text
  • Data
  • Coding
  • 文本编码
  • TEI
  • 数字人文
  • 文本分析
  • XML
  • 数据标准化
  • 语言学
  • 计算机语言学
  • 历史学
  • 文学研究
想要找书就要到 小美书屋
立刻按 ctrl+D收藏本页
你会得到大惊喜!!

具体描述

The Text Encoding Initiative (TEI) Guidelines for Electronic Text Encoding and Interchange are the result of over six years' work by dozens of scholars from all over the world. As such, they represent a pioneer effort in an area where only occasional and isolated attempts were made before. They will certainly serve as the primary basis for encoding texts in electronic form for the foreseeable future. The work of participants in the TEI not only involved consideration of problems of text encoding that are likely to be with us for decades to come, but also required the development of a methodology - from scratch - for approaching these problems. These pioneering efforts, while likely to be refined and extended, must not be lost: they provide the intellectual basis upon which text encoding practices will build in the future. This collection therefore documents the course of these efforts. 'The TEI Guidelines are extraordinary. Even if they were never adopted they would stand as a significant contribution to scholarship for their detailed analysis of the information sets of a huge range of complex text types.' From the Preface by Charles E. Goldfarb, inventor of the Standard Generalized Markup Language.

《文本编码倡议:数字人文的基石》 本书并非关于《Text Encoding Initiative》这本书本身,而是深入探讨了“文本编码倡议”(Text Encoding Initiative,简称 TEI)这一标准及其在数字人文领域的深远影响。TEI 是一套用于描述和标记文本的国际性指南,它提供了一种结构化、标准化且灵活的方式来表示各种类型的文本,从古代手稿到现代出版物,再到新兴的数字原生内容。其核心目标是增强文本的机器可读性、可分析性和长期可访问性,从而为数字人文研究打开新的视野。 TEI 的出现,标志着数字人文研究从简单的文本数字化向更深层次的语义化和结构化转变。它不仅仅是一种标记语言,更是一种研究哲学,倡导对文本的细致入微的理解和表达。书中将详细解析 TEI 的基本构成,包括其核心概念如元素(elements)、属性(attributes)、模型(models)和词汇表(vocabularies)。读者将了解到如何使用 TEI 来准确地标记文本的各个方面,例如章节、段落、词语、名字、地点、时间、引文、注释、修订、甚至是复杂的文本结构如诗歌的格律、戏剧的对白,以及不规则的排版和手写特征。 本书将重点阐述 TEI 在不同领域的应用。在文学研究中,TEI 使得学者能够以前所未有的精度分析文本的结构、风格和主题,进行大规模的文本比较,发现隐藏的模式和联系。例如,通过 TEI 标记,可以精确地追踪人物的出现频率、对话的结构,或者分析特定词汇在不同文本中的演变。在历史研究中,TEI 可以用来标记和分析历史文献,如信件、日记、法律文件等,揭示其内容、来源、以及与其他文献的关系,从而构建更丰富、更具互动性的历史叙事。 此外,本书还将探讨 TEI 在语言学、哲学、艺术史、社会科学等多个学科的应用案例。例如,在语言学中,TEI 可用于标记语料库,支持对语言结构、句法、语义的深入研究;在艺术史中,可以用来描述和分析艺术作品的文本描述,如画作的题跋、雕塑的铭文。本书将通过一系列生动且具有代表性的案例研究,展示 TEI 如何赋能研究者,使其能够提出新的研究问题,并找到创新的解决方案。 除了技术层面的介绍,本书还将深入探讨 TEI 的哲学基础和发展历程。我们将追溯 TEI 标准的起源,了解其如何从早期的人文计算项目中脱颖而出,成为当今数字人文领域的事实标准。同时,本书也会讨论 TEI 在实际应用中面临的挑战,例如学习曲线、社群的建设和维护、以及如何处理不确定性或有争议的文本解释。 本书的另一重要篇章将聚焦于 TEI 的社群和生态系统。TEI 并非一个孤立的技术标准,而是一个活跃、包容的全球性社群。我们将介绍 TEI 的发展组织,以及如何参与到标准的制定和改进中。同时,也将介绍与 TEI 相关的各种工具和资源,包括编辑器、验证器、可视化工具等,帮助读者更便捷地应用 TEI。 最后,本书将展望 TEI 的未来发展趋势。随着人工智能、机器学习等技术的不断进步,TEI 将如何与这些新技术融合,为数字人文研究带来新的可能性?例如,如何利用 TEI 标记的数据训练更智能的文本分析模型,如何实现更高效的文本自动标注,以及如何构建更具互操作性的数字人文知识图谱。本书旨在为数字人文研究者、信息科学家、图书管理员以及所有对文本的数字化和深度分析感兴趣的读者,提供一个全面、深入且实用的指南,帮助他们理解和掌握 TEI,并将其运用到自己的研究和项目中,共同推动数字人文领域的创新与发展。

作者简介

目录信息

读后感

评分

评分

评分

评分

评分

用户评价

评分

这是一本需要被反复阅读的作品,因为它每一遍都会揭示出新的层次。我尤其被其中关于“遗忘”和“未来兼容性”的讨论所触动。作者并没有沉醉于现有技术的优越性,而是冷静地分析了当前编码系统在面对尚未出现的语言和表达方式时的潜在脆弱性。这种前瞻性的批判,让这本书超越了一般的历史回顾。它的论证风格如同严谨的法庭辩论,逻辑严丝合缝,没有留下任何可以被轻易攻击的漏洞。但最让我震撼的,是它对“符号的物质性”的强调——字符不再是抽象的比特流,而是承载着物理世界重量的文化载体。这本书的魅力在于,它将一个看似冰冷的计算机科学领域,赋予了深厚的人文关怀和历史厚度,让人在合上书本时,对信息时代的构建者们产生由衷的敬意。

评分

这本书的结构设计堪称一流,它仿佛是一部多层蛋糕,每一层都有其独特的风味和深度。最表层的,是引人入胜的轶事和故事,关于早期信息交换的滑稽错误和令人啼笑皆非的误解,这些内容让非专业读者也能轻松入门。接着,它开始深入挖掘技术标准制定背后的政治博弈——谁的声音被纳入了标准,谁的声音被边缘化了?这种对“看不见的权力结构”的揭示,是本书最令人不安也最发人深省的部分。我特别欣赏作者处理复杂材料时的克制与精准,没有进行过度的煽情,而是用无可辩驳的事实和逻辑链条来构建论点。它成功地证明了,技术规范从来都不是中立的,它们是社会价值的投影。这本书读起来不像是被动接受知识,更像是在参与一场跨越数十年的严肃辩论,让人不由自主地想加入其中,提出自己的见解。

评分

这部作品简直是一场关于信息本质的深度潜水,它没有落入那些故作高深的术语陷阱,而是以一种近乎诗意的精确度,描绘了我们如何通过符号来构建意义的世界。开篇就抓住人的是作者对“边界”的探讨——数字世界看似无限,实则被无数编码规则小心翼翼地框定着。我尤其欣赏它对历史脉络的梳理,没有将编码视为孤立的技术事件,而是将其置于全球文化交流和权力博弈的宏大叙事之中。比如,书中对比了不同文明在处理语音到文本转换时的哲学差异,这种跨学科的视角让我对日常使用的输入法产生了全新的敬畏感。它不是一本教你写代码的手册,而是一本引导你思考“字符”背后隐藏的宇宙观的哲学导论。读完后,你再看屏幕上的每一个字母、每一个表情符号,都会觉得它们不再是简单的图形,而是无数代人智慧和妥协的结晶。它成功地将技术文档的枯燥转化为对人类认知过程的深刻洞察,读起来酣畅淋漓,引人深思。

评分

我通常对这种偏向理论深度的书籍敬而远之,总担心会掉入晦涩难懂的泥潭,但这本书完全颠覆了我的固有印象。它的语言风格极其富有画面感,即便是描述最抽象的概念,也能让人在脑海中构建出一个清晰的场景。想象一下,作者如何描绘早期的计算机工程师们,如何在有限的内存空间里,如同炼金术士一般,试图将人类全部的语言财富压缩进八位的限制中——那种紧张感和创造力简直令人心潮澎湃。这本书更像是一部关于“命名与存在”的史诗。它没有停留在技术层面讨论UTF-8或ASCII,而是深入探讨了“一个符号如何获得稳定意义”的哲学基础。我被它对不同文化中“书写符号的神圣性”与“机器可读性”之间永恒拉锯的描述所折服。读完后,我感到自己对数字世界的认知被重塑了,那些曾经被视为理所当然的底层逻辑,现在看来充满了人为干预和历史偶然性。

评分

坦白说,我最初是被这本书的书名吸引的,期待着某种关于数据结构或字符集的硬核技术手册,结果却发现这更像是一部编年史,只不过它的主角是那些无形的规则制定者。叙事节奏非常巧妙,它没有采用传统的时间顺序,而是围绕几个关键的“冲突点”展开讨论——比如,当一个古老的象形文字系统试图与现代二进制逻辑对接时,产生的张力是如何被解决或被搁置的。作者的笔力非常老道,他能够将复杂的算法演变描述得如同精彩的侦探小说。我最喜欢的部分是关于“兼容性危机”的案例分析,那种技术人员在面对语言多样性时的挣扎与创造力,被刻画得栩栩如生。这本书的价值不在于提供标准答案,而在于它提出了更深刻的问题:我们为了实现全球互联,究竟牺牲了多少文化原真性?这本书的论证过程严密,引用了大量罕见的历史文献和早期互联网备忘录,显示出作者扎实的学术功底,但阅读体验却丝毫不受影响,反而因为这些“料”而更显厚重。

评分

评分

评分

评分

评分

本站所有内容均为互联网搜索引擎提供的公开搜索信息,本站不存储任何数据与内容,任何内容与数据均与本站无关,如有需要请联系相关搜索引擎包括但不限于百度google,bing,sogou

© 2026 book.quotespace.org All Rights Reserved. 小美书屋 版权所有