两会声音|生僻字的苦侬吃过伐?人大代表提建议了:建设国家生僻字字库
2022-03-04 青年


青年报·青春上海记者 刘昕璐/文 受访者/图、视频 施培琦/剪辑

㛃、䭲、頔……这些字,你都会读吗?即使会读,想要在电脑里用拼音输入法直接敲出来,也很有难度吧。在今年的全国两会上,全国人大代表、致公党上海市委副主委邵志清,将继续围绕数字化转型建言献策。其中的一个小切入点,他瞄准在了生僻字字库上。

   //  生僻字也是一只“拦路虎”  //  

邵志清是一位已履职近十五年的“老代表”。作为一名信息领域专家,他的建议始终围绕“经济、信息化建设、个人信息保护”。今年,他准备带上两会的有2份议案、7份建议。建议之一是关于建设国家生僻字字库、更好方便群众办事。

生僻字是指不常见的或人们不熟悉的汉字,在进入信息化时代后,也指信息系统无法处理的汉字。一旦人的姓名中含有生僻字,就会在各种需要信息系统支持的场景下遇到麻烦,如办理政务事项、搭乘公共交通、就医上学等,全国各地每年都接到不少有关信息系统无法处理含生僻字姓名的投诉。

邵志清说,自己母亲名字中就有一个生僻字,左边一个口,右边一个男。前不久,在办理个人所得税专项附加扣除填写母亲名字时,他倒是欣喜地发现可以用笔画输入了。“今年有了改进,按照笔画录进去,认定就通过了。”

然而,在一些银行为老人办理相关业务时,邵志清仍然会遇到麻烦,银行系统里没有这个字,只能用拼音代替。他身边的同事、朋友在办理事项时也因为名字中的生僻字发生过不少囧事。

周小姐名字里原本有个“㛃”字,多年前,她适逢小升初,名字只有派出所里能打出来,从而造成各种不方便。为了减少麻烦,她的名字从那时候起就索性改为了“洁”。而记者在日常工作中,也因为有时报道对象名字有生僻字而发生过打不出的尴尬。一次,“䭲”这个字因为没有处理好,硬生生地变成里两个独立的字“香”“奇”。

   //  推动国家层面解决问题  //  

自从个人计算机问世后,字符集国家标准迭代升级,收录汉字的字数从最初的6763字,到了目前的8万多字。国际上普遍执行的字符集标准Unicode标准,目前最新版本的Unicode 14.0收录9.5万中日韩文字,基本覆盖最新的GB18030标准。

然而,目前大多数在使用的信息系统在建设时使用相对较老的GBK字符集(收录约2.1万个汉字),超出这个范围之外的汉字就成了这些信息系统无法常规处理的“生僻字”。为了处理这些生僻字,各种信息系统各自寻找办法,但仍然无法解决数据流动和业务协同方面存在的技术障碍。

“字库没有一个统一的标准,公安有公安的,社保有社保的,银行有银行的,现在办事基本上都是信息化,严重依赖于信息系统,但是使用的字库系统不一样就找不到。”在邵志清看来,十四五规划提出“加快数字化发展,建设数字中国”,而生僻字已经成为继老年人不适应信息化系统之后的又一个“数字鸿沟”,应该引起足够重视并予以解决。

目前一些地方已经开始了探索。以上海为例,2021年9月,上海市经济和信息化委员会、上海市大数据中心联合发出《关于开展信息系统生僻字问题改造的通知》,针对群众日常生活中常见服务事项涉及的信息系统进行生僻字支持改造,通过集中采购公安人口信息专用字库并依托“一网通办”技术体系建立生僻字云服务平台,支撑相关政府部门以及医院、药店等医疗机构,试点银行、保险等金融机构,水电煤等公共服务企业的信息系统对生僻字进行技术处理。

如今,改造后的各部门信息系统对生僻字的处理对标公安的身份证处理方法,在成本可接受的范围内从根本上解决姓名中含有生僻字的群众便捷办理公共服务事项的问题。

不过,在国家层面,这一问题依然没有得到很好解决。因此,邵志清此次建议,在国务院电子政务办公室牵头协调下,制定相关技术规范和标准,统一建设生僻字字库,更好方便群众办事。在他看来,这也是落实“人民城市人民建,人民城市为人民”重要理念的应有之义。

“具体包括优化完善信息系统对生僻字的支持标准和检测手段;统筹各地各垂直部门的信息系统生僻字改造工作,统一解决部分字符集商业化的问题等。”邵志清说。

青年报·青春上海记者 刘昕璐/文 受访者/图、视频 施培琦/剪辑

编辑:张红叶

来源:青春上海News—24小时青年报

返回上页 回到首页

青年报社 版权所有

广告热线:021-61173717 | 违法和不良信息举报电话:021-61177819 / 61177827 举报邮箱:services@why.com.cn    测试版