跳转到内容

草稿:DraCor

维基百科,自由的百科全书

DraCor (Drama Corpora) 是一个开放式数字基础设施,用于对从古希腊罗马时代到 20 世纪的欧洲戏剧进行计算研究。该平台收录了以 TEI 格式编码的各种语言的戏剧,支持戏剧研究中的比较和计算方法。截至 2025 年,该平台收集了 20 多种语言的 4000 多个文本。DraCor 提供的数据在数字人文研究中得到了广泛应用。[1] 该项目于 2022 年获得了 TEI 协会颁发的 Rahtz TEI 独创奖。

概述

[编辑]

DraCor 旨在创建可靠、可扩展和可互操作的戏剧文学语料库。该项目强调 “可编程语料库”[3] 的概念,即数据不仅可以访问,还可以通过应用程序接口和与其他工具的集成进行计算分析。该平台努力遵循 FAIR 数据原则(可查找、可访问、可互操作、可重用)。DraCor(Drama Corpora)是一个开放的数字基础设施,用于对从古希腊罗马时代到 20 世纪的欧洲戏剧进行计算研究。该平台托管以 TEI 格式编码的各种语言的戏剧,支持戏剧研究中的比较和计算方法。截至 2025 年,该平台收集了 20 多种语言的 4000 多个文本。DraCor 提供的数据在数字人文研究中得到了广泛应用。[1] 该项目于 2022 年获得了 TEI 协会颁发的 Rahtz TEI 独创奖。

主要功能

[编辑]

多语种语料库: 包含 20 多种语言(主要是欧洲语言)的戏剧语料库。 TEI 编码: 文本根据 TEI 指南进行编码,以保持结构和语义的一致性。 API 访问: 提供文档化的应用编程接口,可通过编程访问文本和元数据。 网络可视化: 生成表示剧中人物共现的网络图。 数据下载: 提供下载文本子集(如演讲稿或舞台说明)以及网络数据的选项。 开放访问: 数据可公开用于研究和相关用途。 可编程语料库:支持与外部分析工具和编程语言集成,提供 Python (pydracor[4]) 和 R (rdracor[5]) API 封装程序。

语料库

[编辑]

DraCor 的语料库不断增加,涵盖法语、德语、英语、俄语、西班牙语、荷兰语、意大利语、匈牙利语、瑞典语、波兰语、乌克兰语、古希腊语、拉丁语和其他语言的戏剧。每个语料库都由学者个人或团队[6] 精心策划,在提供 TEI 编码文本的同时还提供丰富的元数据,支持对戏剧结构、人物互动和相关主题的分析。主要特点 多语种语料库: 包含 20 多种语言(主要是欧洲语言)的戏剧语料库。 TEI 编码: 文本根据 TEI 指南进行编码,以保持结构和语义的一致性。 API 访问: 提供文档化的应用编程接口,可通过编程访问文本和元数据。 网络可视化: 生成表示剧中人物共现的网络图。 数据下载: 提供下载文本子集(如演讲稿或舞台说明)以及网络数据的选项。 开放访问: 数据可公开用于研究和相关用途。 可编程语料库:支持与外部分析工具和编程语言集成,提供 Python (pydracor[4]) 和 R (rdracor[5]) API 封装程序。

工具和使用

[编辑]

DraCor 平台包括基本的可视化工具,特别是用于网络分析的工具。它还支持以编程方式访问语料库,从而能够集成到计算研究工作流程中。这有助于进行各种类型的分析,包括

定量文本分析 字符的社会网络分析 文体测量研究 跨语言的戏剧比较研究

社区、开发、影响

[编辑]

DraCor 由多个机构的研究人员合作开发。作为一个开源项目,它积极鼓励社区贡献和反馈。

外部链接

[编辑]

https://dracor.org/ https://staging.dracor.org/doc/research https://dracor.org/doc/api https://github.com/dracor-org

参考文献

[编辑]
[1] "DraCor Research". dracor.org. Retrieved 16 May 2025.
[2]"Rahtz Prize for TEI Ingenuity". tei-c.org. Retrieved 16 May 2025.
[3]Fischer, Frank; Börner, Ingo; et al. (2019). Programmable Corpora: Introducing DraCor, an Infrastructure for the Research on European Drama. DH2019: “Complexities”. Utrecht University. doi:10.5281/zenodo.4284002.
[4]"pydracor". Python Package Index. Retrieved 21 May 2025.
[5]"rdracor". Comprehensive R Archive Network. 26 September 2024. Retrieved 21 May 2025.
[6]"DraCor Corpus Registry". dracor.org. Retrieved 21 May 2025.
[7]"DraCor Credits". dracor.org. Retrieved 21 May 2025.