跳转到内容

帮助讨论:高级字词转换语法

页面内容不支持其他语言。
添加话题
维基百科,自由的百科全书
Jimmy-bot在话题“地区词fallback问题”中的最新留言:1个月前


请问一下问题是否属于此条目的范畴?

[编辑]

本人在阅读中国大陆简体维基中发现大量条目中的内容出现病句或歧义。后来才意识到是使用其他中文书面语的编辑完成了内容后直接繁简转换的结果。比如:

  • “了”与“有”:任意一动词的完成时的肯定式,在中国的书面语正确表达的“……了”,而在台湾的正确表达的似为“有……”。当然,二者在任意一动词的完成时的否定式上的差别不大:中国“没……”,台湾“没有……”。二者的区别在于,中国的书面语语法中,在“有”后面是不能跟随动词的,只能跟随名词。
  • “得”与“得到”:在中国的书面语语法中,可以被得到的事物是在被得到后发生了所有权改变的事物。而可以被得的事物则没有这个特点。而台湾书面语语法似不使用“得”,“得”与“得到”都使用“得到”。如“罹患了癌症”的表达:中国书面语的正确表达为“得了癌症”,而台湾书面语则是“得到了癌症”。
  • 动名词与动词的差异:在中国的书面语的动名词,在台湾书面语是直接当动词用的。
  1. 如“对第三人施以帮助”的表达:中国书面语的正确表达为“帮他的忙”、“给他帮忙”;而台湾书面语则是“帮忙他”。
  2. 如“对第三人施以帮助”的完成时的表达:中国书面语的正确表达为“帮了他的忙”、“给他帮忙”;而台湾书面语则是“有帮忙他”。
  Hidayetullah (留言) 2017年10月27日

香港影视的马新变体特设次序

[编辑]

赌城风云系列电影反贪风暴系列电影五个小孩的校长怒火 (电影)阿妈有咗第二个饭戏攻心毒舌大状等电影、踩过界欺诈剧团凶宅清洁师青春不要脸食脑丧B下流上车族等剧集可见,香港影视的马新片名,相比中国大陆用名,更接近香港原名。而华语影视的马新变体时常未填写。故此建议香港影视名称的马来西亚/新加坡变体,特设不同寻常的优先次序:马来西亚/新加坡、新加坡/马来西亚、简体、香港、澳门、中国大陆、繁体、台湾。--Gohan 2023年1月25日 (三) 02:20 (UTC)回复

公示7日,2023年2月10日 (五) 04:28 (UTC) 结束。--Gohan 2023年2月3日 (五) 04:28 (UTC)回复
这算不算是原创研究?(虽然原本的转换顺序也没有特别经过分析)或许考虑一下广泛搜集范例,再做决定为宜。—— Eric Liu 創造は生命(留言留名学生会 2023年2月6日 (一) 13:30 (UTC)回复
原来的顺序也是一包一包一,纯粹出于简易。中国大陆包新加坡,即新加坡首选简体、次选中国大陆——并不合理,大马应至少居次。遍览维基百科相关条目以及联合早报、星洲网等来源,真的尚未发现任何一部香港影视在香港原名与中国大陆用名不同时,马新用名会更接近中国大陆用名。搜寻相关综述不得结果,有关字词转换的社群规范本来就是遍地原创研究。--Gohan 2023年2月6日 (一) 14:20 (UTC)回复
技术上可以如何执行呢。如果只是手动调整NoteTA,我认为不需要公示,直接手动调整即可。--Ghren🐦🕑 2023年2月7日 (二) 06:17 (UTC)回复
NoteTA未见有类似设定。若是指逐个调整NoteTA在层出不穷的各条目的具体应用,则未必有兴趣有精力应付,因而需要整体调整。技术上可从相关分类或讯息框下手,符合则适用此顺序。具体不知是否需要meta-wiki的权限者操作。--Gohan 2023年2月8日 (三) 06:03 (UTC)回复
我觉得技术上似乎不太可行。最多也就是请人写个Bot每一个NoteTA都修改一次。--Ghren🐦🕕 2023年2月9日 (四) 22:42 (UTC)回复
若在更基础的结构中不可达成,机器人作业也可接受。若由机器人作业,NoteTA、讯息框、作品名称三种模板可以互填空白;例如其中一个模板有填zh-cn,其余两个模板未填zh-cn,机器人自动填补空白。这项作业若人手完成,更耗费精力。--— 表示就对聚集性疫情进行的打击作出高度评价 2023年2月12日 (日) 07:05 (UTC)回复
@Ericliu1912:也许由于在近年此问题才突出,查不到相关论文,但在中维现有条目中差别十分悬殊。您觉得您的留言能构成“正当合理的意见”吗?若您明确指出构成“正当合理的意见”,我就不宣布此(内容)提案通过。--— 表示就对聚集性疫情进行的打击作出高度评价 2023年2月12日 (日) 07:02 (UTC)回复
是不是有人提起了,所以其他人就开始意识到了,隔壁也有类似讨论Wikipedia:互助客栈/求助#请问为何中文维基百科的繁体中文页面采用的是台湾中文页面的用词?
NoteTA默认的转换涵盖顺序应该不能改的吧,有分歧就逐一手动填,让不同版本显示正确的地区词,不明白为何要调顺序。--Nostalgiacn留言2023年2月26日 (日) 17:17 (UTC)回复

地区词fallback问题

[编辑]

根据WP:地区词处理#转换涵盖顺序zh虽相容zh-hans、zh-hant直接取代,但下位区域转换不影响,比如在超级美钞中,规则zh-hans:朝鲜;zh-hant:朝鮮;zh-tw:北韓会令香港版本fallback至hant而显示为“朝鮮”。

但根据Help:高级字词转换语法#备援语言,zh-hk的fallback选项中mo比hant的优先度更高,即若规则改为zh-hans:朝鲜;zh-hant:朝鮮;zh-mo:北韓,香港版本实际上会fallback至mo而“正确”显示为“北韓”。

mo fallback至hk我能理解,因为澳门变体是后来加的,但hk“反过来”fallback至mo就有点奇怪。我个人认为较合理的fallback原则应为mo->hk->tw->hant->zh->hant->tw->hk->mo,即先往“大一级”找,都没有才看“小一级”。--惣流·明日香·兰格雷不姓 2025年2月23日 (日) 04:21 (UTC)回复

相关资讯:phab:T352554Wikipedia:互助客栈/技术/存档/2024年3月#地区变体fallback到转换组zh字段。——留言2025年2月23日 (日) 07:34 (UTC)回复
zh-hk优先由zh-mo递补合理——由用字最相近地区的字词递补。台湾用字显然不及澳门用字贴近香港。真正不合理的是zh-cn在星马递补次序中优先于港台;不过这就撼动fallback设计大局。--— Gohan 2025年3月1日 (六) 13:00 (UTC)回复
我认为现存问题是机制不清晰,容易误会。比如WP:地区词处理#转换涵盖顺序先说繁体:zh-hant ⊃ zh-tw ⊃ zh-hk ⊃ zh-mo,但实际上因后面的zh虽相容zh-hans、zh-hant直接取代,但下位区域转换不影响,“只填hant”与“只填hant和tw”对hk和mo却有不同效果,最后于另一页面Help:高级字词转换语法#备援语言又有一套“全新规则”。
hk优先由mo递补的问题,虽然“由用字最相近地区的字词递补”有一定道理,但我有一下想法:
  1. 假设North Korea在台湾、香港都称“朝鮮”,而澳门称“北韓”,按照WP:地区词处理,理应zh-tw:朝鮮;zh-mo:北韓足矣,但因Help:高级字词转换语法#备援语言的机制,实际上只有zh-tw:朝鮮;zh-hk:朝鮮;zh-mo:北韓是“正确写法”。
  2. 就人口与出版物而言,香港人看到台湾用词的机会应比看到澳门用字高上不少,再加上“有填mo,没填hk”的情况应该不太多(?),所以我认为“先大后小”的规则不会有大问题,退一步来说,至少mo和tw应一同优先于hant。
--惣流·明日香·兰格雷不姓 2025年3月2日 (日) 04:07 (UTC)回复
正因“有填mo,没填hk”的情况不多,所以“有填tw、mo而未填hk”的情况甚少,此情此景加诸“tw、hk用词相同而与mo不同”更是微乎其微;港澳用字趋同,所以澳门用字不如台湾用字显眼,对香港人过于自然。又如对于香港人,“迪祖高域”胜过“乔科维奇”,“吸血少女攞我命”胜过“人道主义吸血鬼征求自愿献身者”。由于不少hant用于填写并转换任何一地都不作主流使用的字形, (+)倾向支持tw优先于hant递补/后援hk、mo。Wikipedia:地区词处理#转换涵盖顺序是旧有顺序,一年多前就想作出“现实性修订”,但是思前想后似乎会令文字长度及理解难度加倍而不得简洁精炼,于是留有他人思索。--— Gohan 2025年3月3日 (一) 09:38 (UTC)回复
不少hant用于填写并转换任何一地都不作主流使用的字形所言甚是,一种常见用法是hant填“简词繁写”,hans填“繁词简写”作类似单向转换的用途,加上zh、zh-hant、zh-hans“主要用于维护”、默认隐藏,hant和hans现时作为fallback选项的优先度似乎过高了(但cn优先用hans,tw优先用hant又好像没太大问题?)。至于mo于hk的fallback选项队列中的具体位置我没有太大意见,反正hant排在最后就好了。--惣流·明日香·兰格雷不姓 2025年3月4日 (二) 01:06 (UTC)回复