置顶公告:【置顶】关于临时开启评论区所有功能的公告(2022.10.22) | 【置顶】关于本站Widget恢复使用的公告
  • 你好~!欢迎来到萌娘百科镜像站!如需查看或编辑,请联系本站管理员注册账号。
  • 本镜像站和其他萌娘百科的镜像站无关,请注意分别。

UTF8娘

萌娘百科,万物皆可萌的百科全书!转载请标注来源页面的网页链接,并声明引自萌娘百科。内容不可商用。
跳到导航 跳到搜索
Ambox warning blue.svg
此条目于很久以前创建,可能不符合当前的方针收录范围标准。请勿参考此条目编写新条目。
啊嘞?!
怎么回事
这个角色怎么没有头的样子……
基本资料
本名 UTF-8娘
萌点 精通多国文字,可以为世界各地所有欧尼酱提供杀~必~死~哟~

UTF8娘是字符编码UTF-8拟人化萌娘。

简介

UTF8娘出生在一个叫Unicode的国度,自小就致力于学习多个国家的文字,因为性格随和聪慧,全世界几乎所有电脑设备都能看到她的身影,在人们看不到的地方,默默地按照自己的标准为他们将文字和二进制编码间互相转换,比如欧尼酱你现在看到的萌娘百科页面就是UTF8娘为你编码的哦!

普及障碍和独特的优势

UTF8娘有特别的记忆技巧,在尽可能多地精通各国语言文字的前提下,最大限度节约存储空间,采用了可变长字符编码方式,原128个ASCII字符(主要是英文字符)只需要一个字节,拉丁文、阿拉伯文和希伯来文等需要两个字节,而中文、日文和韩文等则需要三个字节,所以某些怪叔叔觉得UTF8娘是在歧视东亚人(实际上很多本土字符编码也是可变长的,例如GBK娘存储汉字需要两个字节,而单字节区间和ASCII也是一样的,算不算本土人自己歧视自己呢?),以至于目前绝大部分中文web站点宁可牺牲设备兼容性,都使用GBK娘(其实是一种强迫症)通常原因不外乎于节约数据库容量和迁移问题,主要以传统行业、政府、银行和老牌大型门户为主。

但可喜的是目前越来越多人意识到采用UTF8娘无论对于开发者,或者使用者都有莫大的好处,哪怕是淘宝买回来根本不支持中文的洋垃圾设备通常都可以很好地浏览UTF8娘编码的中文站点,至于GBK娘的就只能刷出满屏锟斤拷锟斤拷锟斤拷锟斤拷(即UTF-8的��������)。另外UTF8娘在丢失字节的情况下乱码不会扩散,而GB2312娘在丢失字节的情况下会导致后续字符都是乱码[1][2]。所以目前不少新网站,尤其是针对年轻人和IT从业人员的站点都采用了UTF8娘。

注释与外部链接