置顶公告:【置顶】关于临时开启评论区所有功能的公告(2022.10.22) | 【置顶】关于本站Widget恢复使用的公告
  • 你好~!欢迎来到萌娘百科镜像站!如需查看或编辑,请联系本站管理员注册账号。
  • 本镜像站和其他萌娘百科的镜像站无关,请注意分别。

Module:Sandbox

猛汉♂百科,万男皆可猛的百科全书!转载请标注来源页面的网页链接,并声明引自猛汉百科。内容不可商用。
跳到导航 跳到搜索
Template-info.svg 模块文档  [查看] [编辑] [历史] [刷新]

用于测试模块的wiki文本页面:模块:Sandbox/test

由于无法在用户页建立Lua模块,故相关测试可在本页面下进行。
为了保证不把萌娘百科搞得乱七八糟,故将用户创建的测试模块统一组织到该页面的子页面下。
如需创建沙盒模块页面,请使用下方按钮进行创建:


当前已创建沙盒列表:

local p = {}

-- 转化为upvalue,提升速度
local type = type
local ipairs = ipairs
local concat = table.concat
local u_find = mw.ustring.find


local STRIP_MARKER_PREFIX = '\127\'"`UNIQ%-%-'
local STRIP_MARKER_SUFFIX = '%-%x%x%x%x%x%x%x%x%-QINU`"\'\127'
 
---@param s string
---@return string
local function pattern_ignore_case(s)
	return (s:lower():gsub('%l', function (c)
		return '['..c..c:upper()..']'
	end))  -- 括号是为了只返回一个值
end

local nowiki_strip_marker_pattern = STRIP_MARKER_PREFIX..pattern_ignore_case('nowiki')..STRIP_MARKER_SUFFIX

local ruby_templates = { 'Photrans', 'Photrans2', 'Photransa', 'Ruby' }
local ruby_template_indexes = {}
for i, name in ipairs(ruby_templates) do
	ruby_template_indexes[name] = i
end

---@param s string
local function ucfirst(s)
	return s:sub(1, 1):upper()..s:sub(2)
end

local kanji_like_pattern = (function ()
	local kanji_like_unicode_ranges = {
		{ 0x2E80,  0x2EFF },  -- CJK部首补充
		{ 0x3005,  0x3007 },  -- "々、〆、〇"
		{ 0x31C0,  0x31EF },  -- CJK笔画
		{ 0x3400,  0x4DBF },  -- CJK统一表意文字扩展A
		{ 0x4E00,  0x9FFF },  -- CJK统一表意文字
		{ 0xF900,  0xFAFF },  -- CJK兼容表意文字
		{ 0x20000, 0x2A6DF },  -- CJK统一表意文字扩展B
		{ 0x2A700, 0x2EE5F },  -- CJK统一表意文字扩展C-I
		{ 0x2F800, 0x2FA1F },  -- CJK兼容表意文字补充
		{ 0x30000, 0x323AF },  -- CJK统一表意文字扩展G-H
	}
	local char = mw.ustring.char
	local parts = {}
	for i, range in ipairs(kanji_like_unicode_ranges) do
		parts[i] = type(range) == 'table' and char(range[1])..'-'..char(range[2]) or char(range)
	end
	return '['..concat(parts)..']'
end)()

---@param s string
local function is_kanji_like(s)
	return u_find(s, '^'..kanji_like_pattern..'+$')
end

local template_pattern = (function ()
	local name = '%S[^{}|\n]-'
	local arg = '[^{}|=\n]-'
	local arg_with_whitespace = '[ \t]*('..arg..')[ \t]*'
	return '{{%s*('..name..')%s*|'..arg_with_whitespace..'|'..arg_with_whitespace..'}}'
end)()

---获取出现最频繁的ruby模板名
---@param code string
---@return string
local function get_most_frequent_ruby_template_name(code)
	-- 统计代码中`ruby_templates`出现次数,选择出现次数最多的作为`template_name_for_writing`
	-- 代码中没有`ruby_templates`时,选择'Ruby'
	-- 次数并列时,选择靠前的一个
	local count = {}
	for _, name in ipairs(ruby_templates) do
		count[name] = 0
	end
	for template_name in code:gmatch(template_pattern) do
		local capitalized = ucfirst(template_name)
		if count[capitalized] then
			count[capitalized] = count[capitalized] + 1
		end
	end
	local order = {}
	for name, c in pairs(count) do
		order[#order+1] = { name = name, count = c }
	end
	table.sort(order, function (a, b)
		if a.count > b.count then return true end
		if a.count < b.count then return false end
		if ruby_template_indexes[a.name] < ruby_template_indexes[b.name] then return true end
		return false
	end)
	return order[1].name
end


---@param code string
---@param template_name? string
---@return string
function p.transform_code(code, template_name)
	local template_name_for_writing = template_name
	if not template_name then
		template_name = get_most_frequent_ruby_template_name(code)
	end
	local ucfirst_template_name = ucfirst(template_name)
	if not template_name_for_writing and ucfirst_template_name ~= 'Ruby' then
		template_name_for_writing = template_name
	end

	local parts = {
		'{{振假名',
		template_name_for_writing and '|template='..template_name_for_writing or '',
		'\n|',
	}
	parts[#parts+1] = code:gsub(template_pattern, function (name, arg1, arg2)
		if ucfirst(name) ~= ucfirst_template_name then return end
		if not is_kanji_like(arg1) then return end
		return arg1..'('..arg2..')'
	end):match('^\n?(.-)\n?$')
	parts[#parts+1] = '\n}}'

	return concat(parts)
end

function p.transform(frame)
	assert(mw.isSubsting(), '必须subst此模块')

	local args = frame.args
	local code = mw.text.trim(args[1])
	local template_name = args.template ~= '' and args.template or nil
	return p.transform_code(code, template_name)
end

return p