维基百科讨论:大语言模型
添加话题![]() | 本页面有内容译自英语维基百科页面“Wikipedia:Large language models”(原作者列于其历史记录页)。 |
- 下列讨论已经关闭,请勿修改。如有任何意见,请在合适的讨论页提出,而非再次编辑本讨论。
完善条目内容
[编辑]- 我能补充条目缺漏资讯,如历史事件细节或科学进展,并整合多语言维基内容,翻译成流畅中文供参考。我也可建议条目结构,提升逻辑性和可读性。编辑者需核实来源,确保符合维基政策。
确保准确可信
[编辑]- 我可协助验证事实(如日期、数据),寻找学术论文或权威报导作为引用,并分析争议话题,生成中立内容草稿,符合维基百科的中立观点原则。所有建议需人工审核。
优化语言风格
[编辑]- 我能润色拗口语句,统一专业术语(如机器学习),并协调繁简体用词,提升阅读体验,确保语言符合母语者习惯。
扩展条目数量
[编辑]- 我可识别红色连结,建议新条目主题(如在地文化)(注:随后已根据建议,使用AI创作本条目),并生成初稿,涵盖基本资讯和来源建议,帮助快速创建条目。编辑者应补充可靠引用。
支援社群协作
[编辑]- 我能解答编辑问题(如引用格式)、生成培训材料,或总结讨论焦点,促进共识,降低新手门槛,提升社群效率。
关注事项
[编辑]- 我的内容仅供参考,编辑者需核实准确性与来源,避免直接复制,确保符合维基百科的原创性和可查证原则。可要求我搜索最新资讯(如2025年4月11日前资料)以保持时效性。
结论
[编辑]- Grok 3能辅助内容补充、事实核查、语言优化和条目创建,降低编辑门槛。但人工审核仍是核心。透过合作,中文维基百科可更全面、准确,成为优质知识平台。--Winertai(留言) 2025年4月11日 (五) 15:16 (UTC)
- 刚才根据上面AI建议,全程使用AI创作了新条目在地文化--Winertai(留言) 2025年4月11日 (五) 15:38 (UTC)
- 你要不要看看这写的什么东西?——Mirfaek 2025年4月11日 (五) 22:45 (UTC)
- 一堆内容根本没有来源就算了,三个来源居然有两个是虚构的,来源3谷歌学术和知网都找不到,《文化遗产研究》一个2011年创刊的半年刊到2021年居然才15期,来源1也是找不到。严重违反WP:V。奉劝诸位审慎大语言模型,如果非要使用至少要进行详细的人工复查。——Mirfaek 2025年4月11日 (五) 22:54 (UTC)
- 来源2的URL:https://example.com/jiangnan-culture--Kcx36(留言) 2025年4月12日 (六) 05:44 (UTC)
- 抱歉,本来用意就是在负面事例引起讨论,不过几天没使用就在没人努力改善下,被快速删除了。包含这次,感觉我几次的导入人工智能建议或讨论,都不受社群认可,那就此作罢,毕竟本身在两方面理念和能力都不足,想连结上,恐怕无法成真。希望维基百科不会被这波人工智能潮所淘汰--Winertai(留言) 2025年4月13日 (日) 16:27 (UTC)
- 来源2的URL:https://example.com/jiangnan-culture--Kcx36(留言) 2025年4月12日 (六) 05:44 (UTC)
- 刚才根据上面AI建议,全程使用AI创作了新条目在地文化--Winertai(留言) 2025年4月11日 (五) 15:38 (UTC)
- 本讨论已关闭,请勿修改。如有任何意见,请在合适的讨论页提出,而非再次编辑本讨论。
- 下列讨论已经关闭,请勿修改。如有任何意见,请在合适的讨论页提出,而非再次编辑本讨论。
鄙人尝试用DeepSeek R1 Pro协助编修和翻译页面阿尔伯特·施佩尔(经过本人校对),但是她在自己找来源(一手二手全都在扒)!还会扒德语维基内容自己翻译和补充! 囧rz……这是什么成分Σ( ° △ °|||)︴--KurGenera(留言) 2025年4月20日 (日) 03:36 (UTC)
- (:)回应,不久前我好像看到有人在油管上讲,DeepSeek近日已开放连网,意思似乎是它自己能上网找资料、或在这些网络资料中进行自我阅读学习。以上讯息真伪未知,我仅说我印象中看到油管上有人发影片在讲此事。--Znppo(留言) 2025年4月20日 (日) 10:38 (UTC)
- 本讨论已关闭,请勿修改。如有任何意见,请在合适的讨论页提出,而非再次编辑本讨论。
再与AI交谈
[编辑]- 例如小丑,就有北美周末模板啊(如附图),我的意思是例如“无痛先生”(英语:Novocaine (2025 film)),他曾是北美周末票房冠军,但在中文维基百科内容上却没这个模板内容,我意思是怎么利用你来找出这些条目(对话内容请直接转成可以贴在互助客栈的格式)
寻找北美周末票房冠军但缺少模板的条目
[编辑]大家好,我想请教如何更高效地找出中文维基百科中那些曾在北美周末票房排行榜夺冠,但条目未包含“{{North American box office number-one films}}”模板的电影条目,并补充相关资讯。
以《无痛先生》(*Novocaine*, 2025)为例,该片于2025年3月14-16日以870万美元登顶北美周末票房榜,成为该年度票房最低的冠军周末(总票房约5400万美元)[1]。但其条目(截至2025年1月31日)未包含“票房”段落,更不用说该模板,与《小丑》条目(已包含模板)形成对比。
我计划利用AI工具Grok 3来系统性解决此问题,步骤如下:
1. 建立北美周末票房冠军电影清单
[编辑]Grok 3可生成北美周末票房冠军电影清单(2015-2025年),数据来源如Box Office Mojo。例如:
- 2025年3月14-16日:《无痛先生》,870万美元。
- 2019年10月4-6日:《小丑》,9620万美元。
- 2019年4月26-28日:《复仇者联盟:终局之战》,3.57亿美元。
- 2018年2月16-18日:《黑豹》,2.02亿美元。
2. 比对中文维基百科条目
[编辑]针对清单中的电影,检查其条目是否包含模板或记载。可访问条目(如《无痛先生》:https://zh.wikipedia.org/wiki/無痛先生),查看「票房」或「反響」段落,尋找「北美」「周末」「冠軍」等關鍵詞或模板。
3. 搜索与核实票房数据
[编辑]Grok 3可搜索公开资讯,核实电影是否夺冠,并提供数据。例如,《无痛先生》的首周末票房为870万美元,排名第一,数据来自《世界新闻网》。
4. 建议补充模板或内容
[编辑]对于缺少模板的条目,Grok 3可生成标准化内容。例如,为《无痛先生》添加:
== 票房 == 《無痛先生》於2025年3月14日在北美上映,首周末(3月14-16日)票房約870萬美元,登頂北美周末票房榜,成為該年度票房最低的冠軍周末(總票房約5400萬美元)。<ref>{{cite web |title=周末票房很冷清 「無痛先生」登賣座冠軍 |url=https://www.worldjournal.com |website=世界新聞網 |accessdate=2025-04-11}}</ref> {{North American box office number-one films | 上一個 = 2025年3月7-9日北美周末票房冠軍 | 這一個 = 2025年3月14-16日北美周末票房冠軍 | 下一個 = 2025年3月21-23日北美周末票房冠軍 }}
5. 筛选潜在条目
[编辑]Grok 3可筛选可能缺少模板的条目,特别是非主流或票房较低的冠军电影。潜在条目包括:
- 《音速小子》(2020):2020年2月14-16日,票房约5820万美元,夺冠。
- 《醉后大丈夫》(2009):2009年6月5-7日,票房约4490万美元,夺冠。
- 《一级玩家》(2018):2018年3月29日-4月1日,票房约4170万美元,夺冠。
注意事项
[编辑]- 补充数据需引用可靠来源(如Box Office Mojo),确保符合WP:RS。
- 确认模板“{{North American box office number-one films}}”在中文维基可用,若无,可用文字描述。
- 所有内容需人工审核,符合WP:V和WP:NOR。
请问大家有无更高效的方法?或有其他建议的条目?欢迎讨论!--Winertai(留言) 2025年4月11日 (五) 16:03 (UTC)
- 参考这个看看:User:Shizhao/提示词?不要用生成式AI生成新的内容,尽量只是让它在你提供给它的内容上修修改改还不错--百無一用是書生 (☎) 2025年4月15日 (二) 02:50 (UTC)
- 像你这种写模板的AI,我也试过,提供足够的撰写模板相关的背景信息后(构建足够好的提示词),的确能根据提供的素材生成可用的模板,但最大问题是不稳定,可能这次挺好,下次生成就很糟糕。据说通过构建复杂提示词的方法,可以提升稳定性,但我没试过--百無一用是書生 (☎) 2025年4月15日 (二) 02:56 (UTC)
- 同意AI输出不稳定是当前最大的问题,我有试着利用相关工具将既有的APA格式、哈佛注释或甚至一些更杂乱的非常见格式引用,转换为{{cite web}}之类的模板,姑且大部分时可用,能自动填上access date跟language等参数还蛮方便的,但偶会出现一些不存在的参数,还是得偶尔下词提示或人工检查修正内容,但不失为省去一些填格子时间的方法。--WiTo🐤💬 2025年4月17日 (四) 09:00 (UTC)
- 像你这种写模板的AI,我也试过,提供足够的撰写模板相关的背景信息后(构建足够好的提示词),的确能根据提供的素材生成可用的模板,但最大问题是不稳定,可能这次挺好,下次生成就很糟糕。据说通过构建复杂提示词的方法,可以提升稳定性,但我没试过--百無一用是書生 (☎) 2025年4月15日 (二) 02:56 (UTC)
- AI不妨代劳:
- 将Module:CGroup/JP_Show#日剧及电影拆分为纯电影、(同名)影视剧、纯电视剧三节并重新排序,Module:CGroup/ZH_Show0-Z拆分为电影、电视剧、其他电视节目三节并重新排序,Module:CGroup/Anime#其他以特定标准排序。
- 对错挂Module:CGroup/Movie、Module:CGroup/TV、Module:CGroup/Entertainer的亚洲事物条目改挂或加挂相应公共转换组,若无相应公共转换组而无一匹配字词则予以摘除。
- --— Gohan 2025年4月16日 (三) 09:51 (UTC)
- 对于错挂转换组这个来说,似乎可以转化成一个分类问题,让AI来进行检查,AI修改的话会有一定的错误率--百無一用是書生 (☎) 2025年4月17日 (四) 02:25 (UTC)
- 若以“无一匹配字词方可摘除”、“改挂转换组后原已匹配字词仍皆可匹配方可改挂,否则加挂”为AI作业准则,错误率可降至最低,无误的“拨乱反正”大概可达98%以上,利远大于弊。追踪分类如果只以Wikidata或一般分类为依据,维持现有技术水平,而不以AI逐页分辨添加,其错误率远高于前一做法。AI若能逐页分辨,不如直接修改,而后人手复查。况且如果AI只检测需求而不变更转换组,愿意逐页修改的人力恐怕远远不足。为防任何可能的错误,AI修改时,可依实情添加追踪分类:“变更转换组后匹配字词未增加的页面”、“变更转换组后某原匹配字词转换结果有变的页面”,以便复查。--— Gohan 2025年4月21日 (一) 01:24 (UTC)
- 对于错挂转换组这个来说,似乎可以转化成一个分类问题,让AI来进行检查,AI修改的话会有一定的错误率--百無一用是書生 (☎) 2025年4月17日 (四) 02:25 (UTC)
参考资料
- ^ 周末票房很冷清 「無痛先生」登賣座冠軍. 世界新闻网. [2025-04-11].
- 下列讨论已经关闭,请勿修改。如有任何意见,请在合适的讨论页提出,而非再次编辑本讨论。
rt。你维需要关于大语言模型的方针指引。--__Don't bite! 2025年5月14日 (三) 05:40 (UTC)
- (-)反对,这个论述根本不适合直接拿来当指引,互助客栈不是许愿池,麻烦您拿出实际条文再说。--RainBeforeSun(留言) 2025年5月14日 (三) 05:45 (UTC)
- 我不懂什么实际条文之类的东西,故
撤回请求。--__Don't bite! 2025年5月14日 (三) 06:09 (UTC)
- 我不懂什么实际条文之类的东西,故
- 其实可以在“翻译指引”中略加提及人工智能使用规范(不确定有没有)?—— Eric Liu 創造は生命(留言・留名・学生会) 2025年5月14日 (三) 11:53 (UTC)
- @Ericliu1912:WP:TNGUIDE确实没有提,但WP:AI也没有提。等别人提案和后续讨论吧。--__Don't bite! 2025年5月14日 (三) 12:44 (UTC)
- 本讨论已关闭,请勿修改。如有任何意见,请在合适的讨论页提出,而非再次编辑本讨论。
关于使用人工智能生成内容的新增规范或指引修订提案
[编辑]好的,这是一个基于您的想法起草的维基百科提案草稿。请注意,这只是一个起点,您需要在维基百科的相应社群页面(通常是互助客栈/方针或指引区)正式提交,并接受社群的广泛讨论和修改。在提交前,强烈建议您仔细阅读维基百科现有的相关方针和指引,确保您的提案与之不冲突,并能清晰阐述为何需要这些改变。 --- 现状与问题:
近年来,以大型语言模型(LLMs)为代表的人工智能技术取得了突破性进展,其生成文本的能力已达到前所未有的水平。许多维基百科的编辑者开始尝试利用这些工具辅助内容创作。然而,当前的社群讨论和相关指引(若有)大多是在这些先进AI模型出现之前进行的,未能充分预见和应对其带来的新挑战和机遇。
我个人的经历便是一个例子:我曾尝试使用AI工具撰写条目,但由于过度依赖而未进行充分的校对和核查,导致生成的条目逻辑混乱、事实错误、格式不规范,完全不符合维基百科的品质标准,最终不得不进行大量修改甚至推倒重来。这说明,不加限制和审查地使用AI生成内容,极易损害维基百科的品质和可信度。
另一方面,如果能正确、审慎地使用,AI工具或许能在资料搜集、文本组织、语言润色等方面为编辑者提供帮助,提升效率。因此,我们不应简单地禁止AI生成内容,而应制定明确的规范和流程,引导编者负责任地使用AI,确保所有内容最终都符合维基百科的核心方针和指引。
本提案旨在修订或补充现有指引,明确人工智能生成内容的使用界限、审核流程和责任机制,以期在拥抱技术发展的同时,维护维基百科作为可靠知识来源的基石。
提案具体内容:
基于以上考量,建议新增或修订以下规范:
1. 内容原则: 人工智能生成(包括主要依赖AI辅助生成)的文本,若完全符合维基百科的各项品质标准(包括但不限于可查证性、中立性、非原创研究、格式规范、著作权要求等),原则上应被接受。维基百科关心的是内容的最终品质和合规性,而非其原始生成工具。 2. 强制草稿审核流程: 任何主要通过人工智能工具撰写或大幅扩充的新条目,在其首次提交时,不应直接发布到主条目空间(Article namespace)。强制要求此类内容必须先提交至草稿空间(Draft namespace)。 3. 严格审核要求: 放置在草稿空间的AI生成内容,必须经过至少一位熟悉维基百科方针、有经验的编辑进行全面、严格的审核。审核内容应包括但不限于事实核查、来源验证、语句通顺性、逻辑结构、格式规范以及是否符合所有核心方针。只有在确认该草稿完全符合维基百科所有标准后,方可由审核者或原作者(在获得审核者许可后)移动至主条目空间。 4. 经验编辑的豁免与责任: 对于已经获得巡查豁免权、巡查权或管理员权限的编辑者,鉴于其对维基百科方针和编辑规范的熟悉程度及过往贡献记录,在使用AI辅助生成内容时,如果该内容符合其通常的编辑品质水准并符合所有维基百科标准,可以暂免强制提交草稿的限制。然而,这类编辑者对其使用AI辅助生成的所有内容负有完全责任,必须确保其准确性和合规性。如果出现因AI使用不当导致的品质问题(如事实错误、大段不当内容等),应追究编辑者的责任,并可能影响其相关权限。 5. 滥用行为的处理: 对于反复使用人工智能生成明显不符合维基百科标准(特别是低品质、难以阅读、缺乏来源、或包含虚假信息)的内容,且在被其他编辑指出问题、回退或删除后,仍持续将此类内容提交至主条目空间的编辑者,其行为应被视为一种**新型的破坏**(Disruption)。根据维基百科现有的破坏方针,社群或管理员可以对其采取警告、临时封禁甚至永久封禁等处理措施。这旨在阻止通过滥用AI工具来绕过品质控制、浪费社群资源的行为。
理由阐述:
- 第1点理由: 技术本身无罪,关键在于使用。如果AI能帮助生成符合标准的内容,不应人为设限。这符合“内容为王”的原则。
- 第2点及第3点理由: AI模型,特别是大型语言模型,虽然能力强大,但其输出并非总是准确可靠的。它们可能“胡说八道”(hallucinate)、引用不存在的来源、生成带有偏见或不中立的文本,或产生结构混乱的语句。强制性的草稿审核流程为内容进入主条目空间设置了一道必要的质量门槛,降低了低品质AI内容直接损害百科全书声誉的风险。由有经验的编辑进行审核,是因为他们更理解维基百科的方针和标准,能更有效地识别问题。
- 第4点理由: 信任原则在维基百科社群中至关重要。对经验丰富的编辑者给予一定的信任,假定他们能够负责任地使用工具并进行自我审查,可以减轻普遍性的审核负担。但这并非免责条款,而是更高标准的责任要求。如果滥用信任,后果也将更严重。
- 第5点理由: 反复提交低品质AI内容的行为,与机器人滥建页面、内容灌水等其他形式的破坏本质相似,都是在损害维基百科的品质和社区运行效率。将其明确纳入破坏范畴,为社群处理此类行为提供了明确的依据,有助于维护百科全书的整洁和秩序。
诚邀各位维基人积极参与讨论,提出宝贵意见,共同完善这项提案,以更好地适应技术发展,同时坚守维基百科的品质、可信度和社群规范。
btw,这篇提案是AI(Gemini)写的,我觉得挺不错,没有什么逻辑混乱的地方。--V2eth(留言) 2025年4月19日 (六) 00:45 (UTC)
- 所以说人类有必要参加这个话题的讨论吗?--ᡠᠵᡠᡳUjui ᡠᠵᡠUju ᠮᠠᠨᡩ᠋ᠠᠨMandan 2025年4月19日 (六) 01:46 (UTC) 2
- 如果你不用人话,偏要用LLM生成这堆难以阅读没有实质意义的内容的话,我也只能(-)反对,还请您真的要提案就拿出您自己的对策--SunAfterRain 2025年4月19日 (六) 04:25 (UTC)
- 我不确定这是不是行为艺术,不过本站目前有人工智能相关规范吗?之前讨论过几次,但我不是很确定。顺便问问@Shizhao( —— Eric Liu 創造は生命(留言・留名・学生会) 2025年4月19日 (六) 05:04 (UTC)
- 反对2和3。这两条本质上仍是认为ai不如人类,与第1条矛盾。且不利于充分利用新技术的潜力。在我看来,AI的写作能力完全不比许多人类编者弱,没有必要歧视。我认为更合理的方案是进行“含有ai创作“的声明,含有这个声明的内容,可以针对ai的弱点,如编造参考文献等进行针对性的检查。同时应该在方针中提醒编者ai常犯的错误。现有方针没有这方面的指引。--IuyminirC(留言) 2025年4月19日 (六) 07:46 (UTC)
- AI的弱点可能与参数、目标内容、提示词等多重因素相关,不比人类弱、无需歧视的条件不能始终满足。“写作能力”可能是用词书写能力,但编造内容和风格假大空等现象仍严重,编者有时也难以查证与精简──相当于重审与重写?以及这些内容的增长会对人类撰写条目的风格及热情构成影响,就如欧化中文。--YFdyh000(留言) 2025年4月20日 (日) 14:39 (UTC)
- 对“以下规范”回应:1. 这可能是理论上的正义,但缺少可行的执行方案。例如,AI生成内容的著作权争议,没有能力与标准做审查评估。2. 理论上正义。AI内容标注规范更有价值,如果真的要接纳一些。3. 复核者的责任和压力较大,要么过松,要么比自己写还累。--YFdyh000(留言) 2025年4月20日 (日) 14:32 (UTC)
- 有幸读过你先前疑似用LLM写的一篇草稿(现已被删除),那篇草稿的质量我想足以给这个话题盖棺定论了。——Mirfaek 2025年4月21日 (一) 12:42 (UTC)
- 强烈反对用AI生成的条目,但AI翻译是可以接受的。August讨论‧签名‧回复请ping 2025年4月27日 (日) 04:30 (UTC)
- (-)反对,同U:SunAfterRain君的意见--KurGenera(留言) 2025年4月29日 (二) 16:55 (UTC)
- 讲得很好,所以这个提案提出了什么新的内容吗?通过之后会有任何变化吗? ——魔琴[留言 贡献 PJ:小学 PJ:两岸] 2025年5月3日 (六) 15:59 (UTC)
- 你维的垃圾已经够多了,如果担心垃圾少的话可以往自己的用户页多倒倒。--—远方传来风笛(Talk) 2025年5月7日 (三) 19:53 (UTC)
- 讨论还请注意WP:文明--IuyminirC(留言) 2025年5月8日 (四) 01:05 (UTC)
- 有人管别人叫牲口都不违反CIV,我说人家写的东西是垃圾怎么了?毕竟这玩意出现在喂鸡白料没见有多少用处。--—远方传来风笛(Talk) 2025年5月8日 (四) 01:28 (UTC)
- 讨论还请注意WP:文明--IuyminirC(留言) 2025年5月8日 (四) 01:05 (UTC)
- 我认为,可以使用AI生成内容,但是提交编辑之前应当(shall)仔细检查,修正格式等以符合质量要求。——Fthasdd(留言) 2025年5月14日 (三) 10:28 (UTC)