Help talk:高级字词转换语法
添加话题外观
Jimmy-bot在话题“地區詞fallback問題”中的最新留言:1个月前
请问一下问题是否属于此条目的范畴?
[编辑]本人在阅读中国大陆简体维基中发现大量条目中的内容出现病句或歧义。后来才意识到是使用其他中文书面语的编辑完成了内容后直接繁简转换的结果。比如:
- “了”与“有”:任意一动词的完成时的肯定式,在中国的书面语正确表达的“……了”,而在台湾的正确表达的似为“有……”。当然,二者在任意一动词的完成时的否定式上的差别不大:中国“没……”,台湾“没有……”。二者的区别在于,中国的书面语语法中,在“有”后面是不能跟随动词的,只能跟随名词。
- “得”与“得到”:在中国的书面语语法中,可以被得到的事物是在被得到后发生了所有权改变的事物。而可以被得的事物则没有这个特点。而台湾书面语语法似不使用“得”,“得”与“得到”都使用“得到”。如“罹患了癌症”的表达:中国书面语的正确表达为“得了癌症”,而台湾书面语则是“得到了癌症”。
- 动名词与动词的差异:在中国的书面语的动名词,在台湾书面语是直接当动词用的。
- 如“对第三人施以帮助”的表达:中国书面语的正确表达为“帮他的忙”、“给他帮忙”;而台湾书面语则是“帮忙他”。
- 如“对第三人施以帮助”的完成时的表达:中国书面语的正确表达为“帮了他的忙”、“给他帮忙”;而台湾书面语则是“有帮忙他”。
Hidayetullah (留言) 2017年10月27日
香港影視的馬新變體特設次序
[编辑]賭城風雲系列電影、反貪風暴系列電影、五個小孩的校長、怒火 (電影)、阿媽有咗第二個、飯戲攻心、毒舌大狀等電影、踩過界、欺詐劇團、凶宅清潔師、青春不要臉、食腦喪B、下流上車族等劇集可見,香港影視的馬新片名,相比中國大陸用名,更接近香港原名。而華語影視的馬新變體時常未填寫。故此建議香港影視名稱的馬來西亞/新加坡變體,特設不同尋常的優先次序:馬來西亞/新加坡、新加坡/馬來西亞、簡體、香港、澳門、中國大陸、繁體、台灣。--Gohan 2023年1月25日 (三) 02:20 (UTC)
公示7日,2023年2月10日 (五) 04:28 (UTC) 結束。--Gohan 2023年2月3日 (五) 04:28 (UTC)
- 這算不算是原創研究?(雖然原本的轉換順序也沒有特別經過分析)或許考慮一下廣泛蒐集範例,再做決定為宜。—— Eric Liu 創造は生命(留言・留名・學生會) 2023年2月6日 (一) 13:30 (UTC)
- 原來的順序也是一包一包一,純粹出於簡易。中國大陸包新加坡,即新加坡首選簡體、次選中國大陸——並不合理,大馬應至少居次。遍覽維基百科相關條目以及聯合早報、星洲網等來源,真的尚未發現任何一部香港影視在香港原名與中國大陸用名不同時,馬新用名會更接近中國大陸用名。搜尋相關綜述不得結果,有關字詞轉換的社群規範本來就是遍地原創研究。--Gohan 2023年2月6日 (一) 14:20 (UTC)
- 技術上可以如何執行呢。如果只是手動調整NoteTA,我認為不需要公示,直接手動調整即可。--Ghren🐦🕑 2023年2月7日 (二) 06:17 (UTC)
- NoteTA未見有類似設定。若是指逐個調整NoteTA在層出不窮的各條目的具體應用,則未必有興趣有精力應付,因而需要整體調整。技術上可從相關分類或訊息框下手,符合則適用此順序。具體不知是否需要meta-wiki的權限者操作。--Gohan 2023年2月8日 (三) 06:03 (UTC)
- 我觉得技术上似乎不太可行。最多也就是请人写个Bot每一个NoteTA都修改一次。--Ghren🐦🕕 2023年2月9日 (四) 22:42 (UTC)
- 若在更基礎的結構中不可達成,機器人作業也可接受。若由機器人作業,NoteTA、訊息框、作品名稱三種模板可以互填空白;例如其中一個模板有填zh-cn,其餘兩個模板未填zh-cn,機器人自動填補空白。這項作業若人手完成,更耗費精力。--— 我表示就對聚集性疫情進行的打擊作出高度評價 2023年2月12日 (日) 07:05 (UTC)
- 我觉得技术上似乎不太可行。最多也就是请人写个Bot每一个NoteTA都修改一次。--Ghren🐦🕕 2023年2月9日 (四) 22:42 (UTC)
- NoteTA未見有類似設定。若是指逐個調整NoteTA在層出不窮的各條目的具體應用,則未必有興趣有精力應付,因而需要整體調整。技術上可從相關分類或訊息框下手,符合則適用此順序。具體不知是否需要meta-wiki的權限者操作。--Gohan 2023年2月8日 (三) 06:03 (UTC)
- 技術上可以如何執行呢。如果只是手動調整NoteTA,我認為不需要公示,直接手動調整即可。--Ghren🐦🕑 2023年2月7日 (二) 06:17 (UTC)
- @Ericliu1912:也許由於在近年此問題才突出,查不到相關論文,但在中維現有條目中差別十分懸殊。您覺得您的留言能構成“正當合理的意見”嗎?若您明確指出構成“正當合理的意見”,我就不宣佈此(内容)提案通過。--— 我表示就對聚集性疫情進行的打擊作出高度評價 2023年2月12日 (日) 07:02 (UTC)
- 原來的順序也是一包一包一,純粹出於簡易。中國大陸包新加坡,即新加坡首選簡體、次選中國大陸——並不合理,大馬應至少居次。遍覽維基百科相關條目以及聯合早報、星洲網等來源,真的尚未發現任何一部香港影視在香港原名與中國大陸用名不同時,馬新用名會更接近中國大陸用名。搜尋相關綜述不得結果,有關字詞轉換的社群規範本來就是遍地原創研究。--Gohan 2023年2月6日 (一) 14:20 (UTC)
- 是不是有人提起了,所以其他人就開始意識到了,隔壁也有類似討論Wikipedia:互助客栈/求助#請問為何中文維基百科的繁體中文頁面採用的是台灣中文頁面的用詞?
- NoteTA默認的轉換涵蓋順序應該不能改的吧,有分歧就逐一手動填,讓不同版本顯示正確的地區詞,不明白為何要調順序。--Nostalgiacn(留言) 2023年2月26日 (日) 17:17 (UTC)
地區詞fallback問題
[编辑]根據WP:地区词处理#轉換涵蓋順序,zh雖相容zh-hans、zh-hant直接取代,但下位區域轉換不影響
,比如在超級美鈔中,規則zh-hans:朝鲜;zh-hant:朝鮮;zh-tw:北韓
會令香港版本fallback至hant而顯示為“朝鮮”。
但根據Help:高级字词转换语法#備援語言,zh-hk的fallback選項中mo比hant的優先度更高,即若規則改為zh-hans:朝鲜;zh-hant:朝鮮;zh-mo:北韓
,香港版本實際上會fallback至mo而“正確”顯示為“北韓”。
mo fallback至hk我能理解,因為澳門變體是後來加的,但hk“反過來”fallback至mo就有點奇怪。我個人認為較合理的fallback原則應為mo->hk->tw->hant->zh->hant->tw->hk->mo,即先往“大一級”找,都沒有才看“小一級”。--惣流·明日香·蘭格雷不姓式波 2025年2月23日 (日) 04:21 (UTC)
- 相關資訊:phab:T352554、Wikipedia:互助客栈/技术/存档/2024年3月#地區變體fallback到轉換組zh字段。——枰(留言) 2025年2月23日 (日) 07:34 (UTC)
- zh-hk優先由zh-mo遞補合理——由用字最相近地區的字詞遞補。臺灣用字顯然不及澳門用字貼近香港。真正不合理的是zh-cn在星馬遞補次序中優先於港臺;不過這就撼動fallback設計大局。--— Gohan 2025年3月1日 (六) 13:00 (UTC)
- 我認為現存問題是機制不清晰,容易誤會。比如WP:地区词处理#轉換涵蓋順序先説
繁體:zh-hant ⊃ zh-tw ⊃ zh-hk ⊃ zh-mo
,但實際上因後面的zh雖相容zh-hans、zh-hant直接取代,但下位區域轉換不影響
,“只填hant”與“只填hant和tw”對hk和mo卻有不同效果,最後於另一頁面Help:高级字词转换语法#備援語言又有一套“全新規則”。 - hk優先由mo遞補的問題,雖然“由用字最相近地區的字詞遞補”有一定道理,但我有一下想法:
- 假設North Korea在台灣、香港都稱“朝鮮”,而澳門稱“北韓”,按照WP:地区词处理,理應
zh-tw:朝鮮;zh-mo:北韓
足矣,但因Help:高级字词转换语法#備援語言的機制,實際上只有zh-tw:朝鮮;zh-hk:朝鮮;zh-mo:北韓
是“正確寫法”。 - 就人口與出版物而言,香港人看到台灣用詞的機會應比看到澳門用字高上不少,再加上“有填mo,沒填hk”的情況應該不太多(?),所以我認為“先大後小”的規則不會有大問題,退一步來説,至少mo和tw應一同優先於hant。
- 假設North Korea在台灣、香港都稱“朝鮮”,而澳門稱“北韓”,按照WP:地区词处理,理應
- --惣流·明日香·蘭格雷不姓式波 2025年3月2日 (日) 04:07 (UTC)
- 正因「有填mo,沒填hk」的情況不多,所以「有填tw、mo而未填hk」的情況甚少,此情此景加諸「tw、hk用詞相同而與mo不同」更是微乎其微;港澳用字趨同,所以澳門用字不如臺灣用字顯眼,對香港人過於自然。又如對於香港人,「迪祖高域」勝過「喬科維奇」,「吸血少女攞我命」勝過「人道主義吸血鬼徵求自願獻身者」。由於不少hant用於填寫並轉換任何一地都不作主流使用的字形, (+)傾向支持tw優先於hant遞補/後援hk、mo。Wikipedia:地区词处理#轉換涵蓋順序是舊有順序,一年多前就想作出「現實性修訂」,但是思前想後似乎會令文字長度及理解難度加倍而不得簡潔精煉,於是留有他人思索。--— Gohan 2025年3月3日 (一) 09:38 (UTC)
不少hant用於填寫並轉換任何一地都不作主流使用的字形
所言甚是,一種常見用法是hant填“簡詞繁寫”,hans填“繁詞簡寫”作類似單向轉換的用途,加上zh、zh-hant、zh-hans“主要用於維護”、默認隱藏,hant和hans現時作為fallback選項的優先度似乎過高了(但cn優先用hans,tw優先用hant又好像沒太大問題?)。至於mo於hk的fallback選項隊列中的具體位置我沒有太大意見,反正hant排在最後就好了。--惣流·明日香·蘭格雷不姓式波 2025年3月4日 (二) 01:06 (UTC)
- 正因「有填mo,沒填hk」的情況不多,所以「有填tw、mo而未填hk」的情況甚少,此情此景加諸「tw、hk用詞相同而與mo不同」更是微乎其微;港澳用字趨同,所以澳門用字不如臺灣用字顯眼,對香港人過於自然。又如對於香港人,「迪祖高域」勝過「喬科維奇」,「吸血少女攞我命」勝過「人道主義吸血鬼徵求自願獻身者」。由於不少hant用於填寫並轉換任何一地都不作主流使用的字形, (+)傾向支持tw優先於hant遞補/後援hk、mo。Wikipedia:地区词处理#轉換涵蓋順序是舊有順序,一年多前就想作出「現實性修訂」,但是思前想後似乎會令文字長度及理解難度加倍而不得簡潔精煉,於是留有他人思索。--— Gohan 2025年3月3日 (一) 09:38 (UTC)
- 我認為現存問題是機制不清晰,容易誤會。比如WP:地区词处理#轉換涵蓋順序先説