跳至內容

草稿:DraCor

維基百科,自由的百科全書

DraCor (Drama Corpora) 是一個開放式數字基礎設施,用於對從古希臘羅馬時代到 20 世紀的歐洲戲劇進行計算研究。該平台收錄了以 TEI 格式編碼的各種語言的戲劇,支持戲劇研究中的比較和計算方法。截至 2025 年,該平台收集了 20 多種語言的 4000 多個文本。DraCor 提供的數據在數字人文研究中得到了廣泛應用。[1] 該項目於 2022 年獲得了 TEI 協會頒發的 Rahtz TEI 獨創獎。

概述

[編輯]

DraCor 旨在創建可靠、可擴展和可互操作的戲劇文學語料庫。該項目強調 「可編程語料庫」[3] 的概念,即數據不僅可以訪問,還可以通過應用程序接口和與其他工具的集成進行計算分析。該平台努力遵循 FAIR 數據原則(可查找、可訪問、可互操作、可重用)。DraCor(Drama Corpora)是一個開放的數字基礎設施,用於對從古希臘羅馬時代到 20 世紀的歐洲戲劇進行計算研究。該平台託管以 TEI 格式編碼的各種語言的戲劇,支持戲劇研究中的比較和計算方法。截至 2025 年,該平台收集了 20 多種語言的 4000 多個文本。DraCor 提供的數據在數字人文研究中得到了廣泛應用。[1] 該項目於 2022 年獲得了 TEI 協會頒發的 Rahtz TEI 獨創獎。

主要功能

[編輯]

多語種語料庫: 包含 20 多種語言(主要是歐洲語言)的戲劇語料庫。 TEI 編碼: 文本根據 TEI 指南進行編碼,以保持結構和語義的一致性。 API 訪問: 提供文檔化的應用編程接口,可通過編程訪問文本和元數據。 網絡可視化: 生成表示劇中人物共現的網絡圖。 數據下載: 提供下載文本子集(如演講稿或舞台說明)以及網絡數據的選項。 開放訪問: 數據可公開用於研究和相關用途。 可編程語料庫:支持與外部分析工具和編程語言集成,提供 Python (pydracor[4]) 和 R (rdracor[5]) API 封裝程序。

語料庫

[編輯]

DraCor 的語料庫不斷增加,涵蓋法語、德語、英語、俄語、西班牙語、荷蘭語、意大利語、匈牙利語、瑞典語、波蘭語、烏克蘭語、古希臘語、拉丁語和其他語言的戲劇。每個語料庫都由學者個人或團隊[6] 精心策劃,在提供 TEI 編碼文本的同時還提供豐富的元數據,支持對戲劇結構、人物互動和相關主題的分析。主要特點 多語種語料庫: 包含 20 多種語言(主要是歐洲語言)的戲劇語料庫。 TEI 編碼: 文本根據 TEI 指南進行編碼,以保持結構和語義的一致性。 API 訪問: 提供文檔化的應用編程接口,可通過編程訪問文本和元數據。 網絡可視化: 生成表示劇中人物共現的網絡圖。 數據下載: 提供下載文本子集(如演講稿或舞台說明)以及網絡數據的選項。 開放訪問: 數據可公開用於研究和相關用途。 可編程語料庫:支持與外部分析工具和編程語言集成,提供 Python (pydracor[4]) 和 R (rdracor[5]) API 封裝程序。

工具和使用

[編輯]

DraCor 平台包括基本的可視化工具,特別是用於網絡分析的工具。它還支持以編程方式訪問語料庫,從而能夠集成到計算研究工作流程中。這有助於進行各種類型的分析,包括

定量文本分析 字符的社會網絡分析 文體測量研究 跨語言的戲劇比較研究

社區、開發、影響

[編輯]

DraCor 由多個機構的研究人員合作開發。作為一個開源項目,它積極鼓勵社區貢獻和反饋。

外部連結

[編輯]

https://dracor.org/ https://staging.dracor.org/doc/research https://dracor.org/doc/api https://github.com/dracor-org

參考文獻

[編輯]
[1] "DraCor Research". dracor.org. Retrieved 16 May 2025.
[2]"Rahtz Prize for TEI Ingenuity". tei-c.org. Retrieved 16 May 2025.
[3]Fischer, Frank; Börner, Ingo; et al. (2019). Programmable Corpora: Introducing DraCor, an Infrastructure for the Research on European Drama. DH2019: “Complexities”. Utrecht University. doi:10.5281/zenodo.4284002.
[4]"pydracor". Python Package Index. Retrieved 21 May 2025.
[5]"rdracor". Comprehensive R Archive Network. 26 September 2024. Retrieved 21 May 2025.
[6]"DraCor Corpus Registry". dracor.org. Retrieved 21 May 2025.
[7]"DraCor Credits". dracor.org. Retrieved 21 May 2025.