震惊,萌百的中流砥柱竟然是TA们!
跳到导航
跳到搜索
U:Lihaohong/自动化工具 > Lihaohong/贡献用户组统计
简介
选取500个随机条目并统计不同权限的用户(如优编和自确)共贡献了多少字节,最后根据总和算出贡献比例。源代码(由于请求数过多容易WAF,使用pickle缓存结果)。
点开折叠之前先猜一猜结果是什么,对统计方法有疑问可以看下面。大家觉得萌百哪个用户组贡献了最多的字节数呢?是自确还是优编?
统计结果 |
---|
3038131 bytes total. sysop : 0.77% patroller : 5.81% goodeditor : 45.93% honoredmaintainer: 1.34% autoconfirmed : 43.69% user : 2.45% 管理员 巡查姬 荣誉维护人员 优质编辑者 自动确认用户 注册用户 巡查和管理的数量差不多是萌百所有活跃用户的1%,但是贡献了约6%的字节数。 考虑到部分优编已退站,活跃的优编和荣编差不多是所有活跃用户的10%,但是他们贡献了接近一半的字节数。 由于统计仅包括现有用户组,结果其实不太科学。还有一种思路是把荣编、优编、巡查和管理合并为一类“special”,自确和注册用户合并为一类“common”。结果差不多对半开。 special: 53.86% |
5000个随机条目的统计结果 |
---|
37609460 bytes total. sysop : 1.10% patroller : 6.01% goodeditor : 44.87% honoredmaintainer: 1.52% autoconfirmed : 44.55% user : 1.94% special: 53.50% common : 46.50% 管理员 巡查姬 荣誉维护人员 优质编辑者 自动确认用户 注册用户 |
虚拟UP主条目的统计结果 |
---|
20221163 bytes total. sysop : 1.72% patroller : 2.68% goodeditor : 22.73% honoredmaintainer: 0.24% autoconfirmed : 67.26% user : 5.38% 20221163 bytes total. special: 27.36% common : 72.64% 管理员 巡查姬 荣誉维护人员 优质编辑者 自动确认用户 注册用户 虚拟UP主相关编辑们的一贯印象就是有大量自确参与编辑,但只有很少一部分能被转化为萌娘百科的长期编辑者,这个统计与以上数据的对比支持这一猜想。 统计的页面范围是Category:虚拟UP主及其子分类下的所有主名字空间条目。 |
统计方法
- 仅选取主名字空间的随机条目。
- 仅考虑当前的用户组。以上方列表的顺序依次判断。例如,如果有人是技编、优编、自确和注册用户,那么第一个符合要求的用户组是优编。
- 降低字节数的编辑记为+0。
- 所有带mw-undo标签的编辑记为+0。
- ip编辑者记为user(注册用户)用户组。
已知问题
- 新人编辑常常忘记清理预加载残留。
- 拆分页面时编辑历史会丢失,而会去拆分页面的通常是有更多权限的重度编辑。
- 列表类条目常常有超高字节数,但是写出此类条目所需的精力往往更低。歌曲类条目同理(歌词是免费的字节数)。当然,如果自确和优编建此类条目的可能性相等,这就不是问题。
- 部分技术型编辑在主名字空间编辑数较少。
- 优编用户组在萌百初期不存在;其它用户组也常常有不少变化。
详细信息
用户贡献字节数统计 |
---|
|
结论
小编也不知道萌百的中流砥柱是谁。