跳至內容

維基百科:互助客棧/消息/存檔/2012年7月

維基百科,自由的百科全書

中文維基文庫近期被多個語言版本超越

如題。參考[1]。如法語版甚至已經超過英語版,成為第一語言版本。中文版原為第三,現在為第六,下方葡萄牙語版亦在加速。本人是技術盲,若各位能把之前百科上加條目的技術能力用於文庫,實在是功德一件。現舉資料庫一例[2],歡迎各位高手參與協助。--Zhxy 519留言2012年6月5日 (二) 07:11 (UTC)

文庫的來源都是任意格式的文本,不如百科來源的資料庫的格式整齊好處理。Liangent留言 2012年6月5日 (二) 09:06 (UTC)
內地各地政府工作報告、五年計劃及規劃、各地政府命令和地方法規。可收的多著呢。--達師218372 2012年6月5日 (二) 12:20 (UTC)
正是。所以如果類似之前百科刷條目的方法能用在文庫上就再好不過了。--Zhxy 519留言2012年6月5日 (二) 14:06 (UTC)
(猜的)內地很多發布的此類文檔都是從Word直接複製到支持WYSIWYGCMS裡面,格式亂得很。Liangent留言 2012年6月5日 (二) 14:36 (UTC)
內地可直接瀏覽的網站似乎文庫已經包括了大部分,但很多都存在簡繁轉換問題。以前刷過的s:全唐文資料庫是利用某網站的漏洞下下來的。
另一大擴充條目數來源是擴展已有條目。比如s:范文正公集,希望使用機器人將沒有標點的五言/七言詩加上標點。手工與小程序加上標點的s:范文正公集/卷01可作為此類頁面的範例。另外,這個文集的來源就是正體的,不存在簡繁問題。
希望大學生維基人,可以利用校園可訪問的資料庫下載原文。(大量下載小心不要被抓到,抓到似乎是要罰款的。)
另外,我想重新提起一件似乎已經被否決過的事(具體記不清了)。一些計算機軟體,包括加密的古文資料庫(古文已經全部為公有領域),如果破解這些資料庫,將文本公布在網上,應該不違法吧?

--王小朋友留言2012年6月6日 (三) 11:08 (UTC)


不是文庫也要刷機器人吧…………——路過圍觀人士 2012年6月5日 (二) 15:42 (UTC)
可是一般的公文有關注度麼……--鐵鐵的火大了留言2012年6月6日 (三) 14:33 (UTC)
人肉機器人曾經在中文維基文庫製造大量錯字條目,例如[3],已改正的少之又少。--Mewaqua 2012年6月11日 (一) 05:14 (UTC)
這就是王小朋友當年幹的。而且他現在也在這樣幹。機器人如果把機器轉換的文章貼上去,這就是胡鬧。--Zhxy 519留言2012年6月13日 (三) 07:10 (UTC)
我也曾經改過一些王小朋友的錯別字,古文最好用正體的來源,機械地簡體轉繁體,會出現很多錯別字,必須人手校正,如果沒有能力校正,那就最好不要亂來,看著這些白字連篇的文章,真是維基文庫的敗筆。--Quest for Truth留言2012年7月2日 (一) 20:05 (UTC)
維基搜索不支持簡繁轉換,我是在想,都是正體字便於搜索。另外一點,我敢說網際網路上便於找到的古文的80%以上都已經在維基文庫有了。我們下一步應該找資料庫錄入。資料庫裡都是正體原文。--王小朋友留言2012年7月8日 (日) 13:43 (UTC)

我覺得維基文庫其實應該要做「版本學」的比較,這樣光是一本古書,就會因為版本而產生很多條。而且這對學術研究會有幫助。--章·安德魯留言2012年6月6日 (三) 16:19 (UTC)

我不反對。但是人手確實不夠。如果說有機器人先導入,再由編輯者們校對、比較版本,這樣會更好。--Zhxy 519留言2012年6月8日 (五) 16:48 (UTC)
我表示中立態度,現在最好吧維基百科搞好,藉助姐妹計劃的模板其他的維基項目也能帶動起來,關鍵是百科。Qa003qa003留言2012年6月10日 (日) 08:32 (UTC)
我既然參與了文庫項目,就談不上顧此失彼,對我來講沒有主次,都是平等的。--Zhxy 519留言2012年6月12日 (二) 17:47 (UTC)
個人感覺,文庫在處理古籍版本的問題(不是專指中文版),貌似沒有一個比較統一的看法,有的同一個文章會建立不同版本,有的則是把不同版本都放在一起。我覺得用技術手段把同一個文章的不同版本放在一起是值得探索的嘗試,即使是用作學習研究也很方便--百無一用是書生 () 2012年6月11日 (一) 02:34 (UTC)
其實現在一個文章建立不同版本相對主流吧。技術手段有就應該嘗試,問題是我是技術盲。--Zhxy 519留言2012年6月12日 (二) 17:47 (UTC)
我記得法語版做過一個頁面多個版本的嘗試--百無一用是書生 () 2012年6月13日 (三) 01:14 (UTC)
建議推廣https連結以便中國大陸用戶參加--2011wp留言2012年6月16日 (六) 03:29 (UTC)
可能封鎖整個維基媒體基金會的https。--王小朋友留言2012年6月22日 (五) 02:15 (UTC)

我給各位推薦一批資料庫吧。

http://202.204.33.222/tpi_19/sysasp/include/index.asp
http://www.lib.pku.edu.cn/portal/index.jsp
http://www.dag.pku.edu.cn/
http://lib.tsinghua.edu.cn/dra/
http://lib.cuc.edu.cn/cuc/index.htm
http://lib.bfsu.edu.cn/

-- ──★──  2012年7月12日 (四) 14:29 (UTC)

再推薦一批

http://www.cfau.edu.cn/mainweb/xxzy/main.php
http://www.ccmusic.edu.cn/ccmusic/tushuguan/
http://lib.bda.edu.cn/
http://lib.nacta.edu.cn/
http://www.lib.shnu.edu.cn/
http://www.fudan.edu.cn/new_comservice/comservice.htm
http://www.lib.tongji.edu.cn/
http://www.sjtu.edu.cn/left/wbjd.htm
http://lib.shutcm.edu.cn/
http://www.lib.ecnu.edu.cn/
http://lib.shisu.edu.cn/
http://www.sta.edu.cn/list.aspx?nid=76
http://www.sus.edu.cn/web/tsg/index
http://www.lib.shu.edu.cn/
http://lib.sbs.edu.cn/
http://www.gymy.cn/jsp/quick-link/library.jsp

-- ──★──  2012年7月13日 (五) 09:59 (UTC)

問:刪除自己建立的頁面?

中文版和葡萄牙語版的條目數之間有一個「斷層」

以條目數里程碑來看:

維基百科各語言條目里程碑
里程碑 語言(依到達里程碑先後排列)
4,000,000 英語(2012年7月13日)
3,000,000
2,000,000
1,500,000
1,000,000 德語(2009年12月17日);法語(2010年9月21日);荷蘭語(2011年12月17日)
900,000 義大利語(2012年3月12日);波蘭語(2012年6月4日);西班牙語(2012年6月29日)
800,000 俄語(2011年12月10日);日語(2012年4月3日)
700,000 葡萄牙語(2011年10月8日)
600,000
500,000 中文(2012年7月14日)
400,000 瑞典語(2011年6月19日);越南語(2012年4月11日)
300,000 加泰隆尼亞語(2010年12月21日);挪威語(2011年5月6日);烏克蘭語(2011年7月7日);芬蘭語(2012年6月26日)

來源:模板:維基百科各語言條目里程碑

首先,英文版幾乎等於完全甩開其它語言,與德文版差距超過2,500,000條,倍數也超過2.5倍,這是因為它是全球性的語言。再來,從義大利文一直到葡萄牙文都很密集,唯獨葡萄牙文和中文竟相差了二十多萬條,這是怎麼回事?111.248.20.39留言2012年7月15日 (日) 07:31 (UTC)

葡萄牙語有3億人口--Dragoon16c留言2012年7月15日 (日) 08:18 (UTC)
書寫上與西班牙語很接近。--Aoke1989留言2012年7月15日 (日) 08:25 (UTC)
因為歐洲語言刷條目比中文方便,很多條目直接照搬就是了,中文還得譯成漢字:)--Tianyamm2留言2012年7月15日 (日) 09:40 (UTC)
而且西方國家維基社群編輯維百的積極性很高,他們當中的「專業戶」也比較多,就像這樣。-- ──★──  2012年7月15日 (日) 11:20 (UTC)

以社群大小和活躍度來說,中文和葡語(以及荷語版)是大致上同等級的。和這兩版條目數的差異,主要就是差在機器人條目數量了。其他條目數比我們多的8個版本,那的確編輯社群比我們強大。ffaarr (talk) 2012年7月15日 (日) 12:00 (UTC)

圖像過濾器

理事會決定撤回原先關於研發圖像過濾器的決定(Jimbo投了反對票,果然)。wmf:Resolution: Personal Image Hiding Feature --Ben.MQ 2012年7月14日 (六) 23:28 (UTC)

從過去到現在的多語言條目增長圖

這個連結:維基百科數據:條目計數 (正式)只做到2010年4月,有沒有到現在的條目增長圖?-Doraencyclopedia留言2012年7月17日 (二) 09:39 (UTC)

要很多個語言的。-Doraencyclopedia留言2012年7月17日 (二) 09:56 (UTC)
這個行嗎--YFdyh000 2012年7月17日 (二) 14:14 (UTC)
還有嗎?對了,找到一個東西了:條目增長(到2010年12月)-Doraencyclopedia留言2012年7月17日 (二) 15:47 (UTC)
這個圖這個表格?--YFdyh000 2012年7月17日 (二) 16:11 (UTC)
表格好像有些怪怪的,比如說為什麼sv(瑞典語)會是710K(71萬)?-Doraencyclopedia留言2012年7月17日 (二) 16:35 (UTC)
是挺怪,不知道為什麼。那看這個每月平均 每天新增條目數的表格吧。--YFdyh000 2012年7月17日 (二) 17:18 (UTC)
這表格不錯,但是您給的條目數增長圖好像都是對數圖,有沒有像我給的第一個連結那樣的圖?-Doraencyclopedia留言2012年7月18日 (三) 05:13 (UTC)
看到了類似的圖(您給的),但是並沒有很多個語言(只到義大利語)。-Doraencyclopedia留言2012年7月18日 (三) 05:50 (UTC)

BBC:走到台前來的維基百科男女寫手們

譯言:http://select.yeeyan.org/view/18312/302511 --Fanglongzong(╯3╰) 2012年7月18日 (三) 08:48 (UTC)

似乎是前一陣的story teller?-Mys 721tx(留言) 2012年7月18日 (三) 09:06 (UTC)

Musashi1945 用戶正在條目破壞

看到了一位形式為IPv6的匿名用戶

這個連結2001:DA8:215:C526:593:96FB:B308:ADFD--Doraencyclopedia留言2012年7月16日 (一) 07:30 (UTC)

一個多月前開始的。--MakecatTalkDC10 2012年7月16日 (一) 07:32 (UTC)
樓主火星了——今晚找錯誤去!留言/貢獻2012年7月20日 (五) 11:42 (UTC)

俄語維基百科黑屏抗議

本來因為莫斯科新增了行政區要過去找資料,殊不知俄語維基百科今天(7月10日)像上次維基媒體集體抗議SOPA/PIPA般將所有頁面換成抗議標語,Google翻譯再整理一下:

今天7月10日國家杜馬議會的聽證會準備通過一項允許超法規的網絡審查的資訊法案的修正案,而且其修正內容將會導致俄語維基百科的關閉。

-- 同舟留言) 2012年7月10日 (二)

01:13 (UTC)

囧rz...:英文維基百科開了先例啊……哪天中文維基百科會不會也推一個。--KOKUYO留言2012年7月10日 (二) 01:43 (UTC)
俄羅斯國家杜馬法案89417-6——路過圍觀人士 2012年7月10日 (二) 02:44 (UTC)
(-)反對法案通過!我也本來打算去俄語維基找找下諾夫哥羅德纜車的更多信息,結果……剛去yandex了一下,發現連遊戲論壇都有人在討論此事…… --Алексеевский Скажите,пожалуйста! 2012年7月10日 (二) 02:55 (UTC)
這個黑屏比上次的強多了.....卍田卐JC1 2012年7月10日 (二) 07:22 (UTC)


該法案已經通過。俄羅斯議會上院通過網際網路審查法律 --Zhxy 519留言2012年7月21日 (六) 08:28 (UTC)

Help decide about more than $10 million of Wikimedia donations in the coming year

(Apologies if this message isn't in your language. Please consider translating it)

Hi,

As many of you are aware, the Wikimedia Board of Trustees recently initiated important changes in the way that money is being distributed within the Wikimedia movement. As part of this, a new community-led "Funds Dissemination Committee" (FDC) is currently being set up. Already in 2012-13, its recommendations will guide the decisions about the distribution of over 10 million US dollars among the Foundation, chapters and other eligible entities.

Now, seven capable, knowledgeable and trustworthy community members are sought to volunteer on the initial Funds Dissemination Committee. It is expected to take up its work in September. In addition, a community member is sought to be the Ombudsperson for the FDC process. If you are interested in joining the committee, read the call for volunteers. Nominations are planned to close on August 15.

--Anasuya Sengupta, Director of Global Learning and Grantmaking, Wikimedia Foundation 2012年7月19日 (四) 20:31 (UTC)

Distributed via Global message delivery. (Wrong page? Fix here.)

好吧,我就看懂了「this message isn't in your language」這句……--鐵鐵的火大了留言2012年7月23日 (一) 07:00 (UTC)
機器翻譯一下:--KOKUYO留言2012年7月23日 (一) 07:58 (UTC)

幫助決定未來的一年維基百科有超過1千萬捐款的用途

(抱歉,如果這個消息是不是你所用的語言,請考慮自行將文章進行翻譯)

嗨,正如許多人可能已經知道的,維基媒體基金會的資金負責者決定要在最近展開重大的改變,特別是針對有關維基媒體基金會將會就資金分配上作出動作。而作為計畫的第一部分,目前正在設立一個全新且以社群為主導的「資金分配委員會」(FDC)。而在2012年和2013年年度,將會藉由委員會來決定過1千萬美元將會用在哪些計畫的基礎,這可能是維基媒體基金會、某個計畫或者其他符合資格的機構

現在7名有能力、有智慧且值得信賴的社群成員,決定要開始徵求志願者加入剛建立的資金分配委員會,並預計委員會將在9月開始運作。此外,我們也需要社群成員來擔任資金分配委員會的監督者。如果你有興趣加入該委員會,請閱讀我們對志願者的呼籲,報名將計劃在8月15日結束。

─維基媒體基金會全球教育與捐款應用主任阿那蘇耶·森古普塔2012年8月19日(四)20時31分(UTC)

問:請問如何刪除存檔裏自己的留言記錄 謝謝

問:我好心做壞事嗎?

中文版wikiHow有望在今年9月上線

中文wikiHow(預覽版)首頁截圖

同樣基於MediaWiki的「怎麼做」文章的外延資料庫網站wikiHow已經全面展開了中文本地化和調試工作,預計將於今年9月左右正式上線。從預覽版截圖來看,目前中文版wikiHow界面均為簡體中文,暫無簡繁轉換功能,預計之後開發者們可能會添加簡繁轉換插件。 ——張樹人留言)- LGBT協會 2012年7月26日 (四) 05:33 (UTC)

修一下版權資訊吧。Ben.MQ 2012年7月26日 (四) 08:41 (UTC)