草稿:DraCor
![]() | 本草稿尚未提交審核
提交前,请先查閱維基百科不是什麼,以免犯下常見錯誤。 要让草稿被接受,需要至少满足以下要求:
我们强烈不鼓励您創建與您自己、您所在的組織、其對手或其產品相關的條目。如果您仍要这么做,请申报利益冲突。 注意:若您提交之后,本模板出现在页面最下方,表示您已成功提交。
如何改善您的草稿
| ![]() |
DraCor (Drama Corpora) 是一个开放式数字基础设施,用于对从古希腊罗马时代到 20 世纪的欧洲戏剧进行计算研究。该平台收录了以 TEI 格式编码的各种语言的戏剧,支持戏剧研究中的比较和计算方法。截至 2025 年,该平台收集了 20 多种语言的 4000 多个文本。DraCor 提供的数据在数字人文研究中得到了广泛应用。[1] 该项目于 2022 年获得了 TEI 协会颁发的 Rahtz TEI 独创奖。
概述
[编辑]DraCor 旨在创建可靠、可扩展和可互操作的戏剧文学语料库。该项目强调 “可编程语料库”[3] 的概念,即数据不仅可以访问,还可以通过应用程序接口和与其他工具的集成进行计算分析。该平台努力遵循 FAIR 数据原则(可查找、可访问、可互操作、可重用)。DraCor(Drama Corpora)是一个开放的数字基础设施,用于对从古希腊罗马时代到 20 世纪的欧洲戏剧进行计算研究。该平台托管以 TEI 格式编码的各种语言的戏剧,支持戏剧研究中的比较和计算方法。截至 2025 年,该平台收集了 20 多种语言的 4000 多个文本。DraCor 提供的数据在数字人文研究中得到了广泛应用。[1] 该项目于 2022 年获得了 TEI 协会颁发的 Rahtz TEI 独创奖。
主要功能
[编辑]多语种语料库: 包含 20 多种语言(主要是欧洲语言)的戏剧语料库。 TEI 编码: 文本根据 TEI 指南进行编码,以保持结构和语义的一致性。 API 访问: 提供文档化的应用编程接口,可通过编程访问文本和元数据。 网络可视化: 生成表示剧中人物共现的网络图。 数据下载: 提供下载文本子集(如演讲稿或舞台说明)以及网络数据的选项。 开放访问: 数据可公开用于研究和相关用途。 可编程语料库:支持与外部分析工具和编程语言集成,提供 Python (pydracor[4]) 和 R (rdracor[5]) API 封装程序。
语料库
[编辑]DraCor 的语料库不断增加,涵盖法语、德语、英语、俄语、西班牙语、荷兰语、意大利语、匈牙利语、瑞典语、波兰语、乌克兰语、古希腊语、拉丁语和其他语言的戏剧。每个语料库都由学者个人或团队[6] 精心策划,在提供 TEI 编码文本的同时还提供丰富的元数据,支持对戏剧结构、人物互动和相关主题的分析。主要特点 多语种语料库: 包含 20 多种语言(主要是欧洲语言)的戏剧语料库。 TEI 编码: 文本根据 TEI 指南进行编码,以保持结构和语义的一致性。 API 访问: 提供文档化的应用编程接口,可通过编程访问文本和元数据。 网络可视化: 生成表示剧中人物共现的网络图。 数据下载: 提供下载文本子集(如演讲稿或舞台说明)以及网络数据的选项。 开放访问: 数据可公开用于研究和相关用途。 可编程语料库:支持与外部分析工具和编程语言集成,提供 Python (pydracor[4]) 和 R (rdracor[5]) API 封装程序。
工具和使用
[编辑]DraCor 平台包括基本的可视化工具,特别是用于网络分析的工具。它还支持以编程方式访问语料库,从而能够集成到计算研究工作流程中。这有助于进行各种类型的分析,包括
定量文本分析 字符的社会网络分析 文体测量研究 跨语言的戏剧比较研究
社区、开发、影响
[编辑]DraCor 由多个机构的研究人员合作开发。作为一个开源项目,它积极鼓励社区贡献和反馈。
外部链接
[编辑]https://dracor.org/ https://staging.dracor.org/doc/research https://dracor.org/doc/api https://github.com/dracor-org
参考文献
[编辑][1] "DraCor Research". dracor.org. Retrieved 16 May 2025. [2]"Rahtz Prize for TEI Ingenuity". tei-c.org. Retrieved 16 May 2025. [3]Fischer, Frank; Börner, Ingo; et al. (2019). Programmable Corpora: Introducing DraCor, an Infrastructure for the Research on European Drama. DH2019: “Complexities”. Utrecht University. doi:10.5281/zenodo.4284002. [4]"pydracor". Python Package Index. Retrieved 21 May 2025. [5]"rdracor". Comprehensive R Archive Network. 26 September 2024. Retrieved 21 May 2025. [6]"DraCor Corpus Registry". dracor.org. Retrieved 21 May 2025. [7]"DraCor Credits". dracor.org. Retrieved 21 May 2025.