震惊,萌百的中流砥柱竟然是TA们!
跳至導覽
跳至搜尋
U:Lihaohong/自動化工具 > Lihaohong/貢獻用戶組統計
簡介
選取500個隨機條目並統計不同權限的用戶(如優編和自確)共貢獻了多少字節,最後根據總和算出貢獻比例。原始碼(由於請求數過多容易WAF,使用pickle緩存結果)。
點開摺疊之前先猜一猜結果是什麼,對統計方法有疑問可以看下面。大家覺得萌百哪個用戶組貢獻了最多的字節數呢?是自確還是優編?
統計結果 |
---|
3038131 bytes total. sysop : 0.77% patroller : 5.81% goodeditor : 45.93% honoredmaintainer: 1.34% autoconfirmed : 43.69% user : 2.45% 管理員 巡查姬 榮譽維護人員 優質編輯者 自動確認使用者 註冊用戶 巡查和管理的數量差不多是萌百所有活躍用戶的1%,但是貢獻了約6%的字節數。 考慮到部分優編已退站,活躍的優編和榮編差不多是所有活躍用戶的10%,但是他們貢獻了接近一半的字節數。 由於統計僅包括現有用戶組,結果其實不太科學。還有一種思路是把榮編、優編、巡查和管理合併為一類「special」,自確和註冊用戶合併為一類「common」。結果差不多對半開。 special: 53.86% |
5000個隨機條目的統計結果 |
---|
37609460 bytes total. sysop : 1.10% patroller : 6.01% goodeditor : 44.87% honoredmaintainer: 1.52% autoconfirmed : 44.55% user : 1.94% special: 53.50% common : 46.50% 管理員 巡查姬 榮譽維護人員 優質編輯者 自動確認使用者 註冊用戶 |
虛擬UP主條目的統計結果 |
---|
20221163 bytes total. sysop : 1.72% patroller : 2.68% goodeditor : 22.73% honoredmaintainer: 0.24% autoconfirmed : 67.26% user : 5.38% 20221163 bytes total. special: 27.36% common : 72.64% 管理員 巡查姬 榮譽維護人員 優質編輯者 自動確認使用者 註冊用戶 虛擬UP主相關編輯們的一貫印象就是有大量自確參與編輯,但只有很少一部分能被轉化為萌娘百科的長期編輯者,這個統計與以上數據的對比支持這一猜想。 統計的頁面範圍是Category:虛擬UP主及其子分類下的所有主名字空間條目。 |
統計方法
- 僅選取主名字空間的隨機條目。
- 僅考慮當前的用戶組。以上方列表的順序依次判斷。例如,如果有人是技編、優編、自確和註冊用戶,那麼第一個符合要求的用戶組是優編。
- 降低字節數的編輯記為+0。
- 所有帶mw-undo標籤的編輯記為+0。
- ip編輯者記為user(註冊用戶)用戶組。
已知問題
- 新人編輯常常忘記清理預加載殘留。
- 拆分頁面時編輯歷史會丟失,而會去拆分頁面的通常是有更多權限的重度編輯。
- 列表類條目常常有超高字節數,但是寫出此類條目所需的精力往往更低。歌曲類條目同理(歌詞是免費的字節數)。當然,如果自確和優編建此類條目的可能性相等,這就不是問題。
- 部分技術型編輯在主名字空間編輯數較少。
- 優編用戶組在萌百初期不存在;其它用戶組也常常有不少變化。
詳細信息
用戶貢獻字節數統計 |
---|
|
結論
小編也不知道萌百的中流砥柱是誰。