颜真卿写错了字?上海高校这些“冷门绝学”传承人,亮出“秘密武器”来求证
2021-06-06 青年

青年报·青春上海记者 刘昕璐/文 施培琦/图、视频(除署名外)

50后的刘志基,在上世纪80年代学习古文字时,必备的 “三件宝”是一本《说文解字》、一把放大镜和一支毛笔;00后的宋楚莹,如今在学习古文字时最重要的学习工具是电脑,一台可以联通“智能检索中国文字数据库”的电脑,即使完全不认识,也可以靠强大的后台数据库“按图索骥”。

曾经“为找一书走遍天下,为查一字翻遍全书”的艰辛,自然已是很难想象了。历代千万文字可智能识别,如此大环境的改善和发展的背后,正是高校通过研发智能型数据库传承“冷门绝学”的那份努力和成效。

◆ 直观一课 

   古文字溯源从“热搜”查证开始

不久前,一名书法家认为“颜真卿写错了字”的事件在网上发酵,这引起华东师范大学“古文字学(强基计划)”大一学生宋楚莹和小伙伴们的探讨兴趣:“刺史”的“刺”,颜真卿为什么写成“刾”?

学校老师抓住这个契机,运用“智能检索中国文字数据库”给同学上了直观一课。

老师们先引导同学进入“石刻智能检索数据库”,运用该数据库嵌入的“石刻疑难字形智能识别器”,识别出唐代文字中貌似“刾”的那个字,识别结果,让同学们了解,当时的“刺”大概率写成“刾”。而这个“刾”中的“夹”,就是“朿”的自秦汉文字以来的变形。

受访者/图

继而,老师又引导同学进入“甲骨文智能检索数据库”,运用其嵌入“甲骨文智能镜”识别甲骨文的“朿”,进入“商周金文智能检索数据库”,运用其嵌入“商周金文智能镜” 识别商周金文的“朿”,进入“战国楚简文字智能检索数据库”,运用其嵌入的“楚简文字智能识别器”识别战国楚简的“朿”。最终,同学们了解到:“朿”字之形,取象于“树木的刺芒”,正是先秦时代的“刺”。

受访者/图

同学们的这次查证借助的正是华东师范大学利用图像识别工具与数据库结合创建的智能型“中国文字数字平台”,该平台现已取得重大成果,殷商甲骨文、商周金文、战国楚简等,那些出现在铜器、竹简、石刻等材料上超过1000万个历代出土实物文字、可搜集到的文字,都以文字和图像全数字化的形式收入平台,继而可以运用数字化方式来处理和研究。

类似使用网上购物平台“扫一扫”功能就能出现对应的物品购买通道,数字平台里的“智能镜”能帮助使用者“按图索骥”,迅速查到 “字海”,查出这是什么字,原始出处为何。

记者了解到,提供覆盖整个汉字发展史的相关文字信息的检索查询,这项横跨中国文字学与计算机科学等学科的新文科建设新成果的运用,其背后是“冷门绝学”百余人团队20多年磨一剑,从而营造出的3000年汉字数字长城。

◆ 今昔对比 

   研究环境已是天壤之别

看着当下00后学生学习古文字专业的环境如此便捷,华东师范大学中国文字研究与应用中心副主任刘志基满是感慨和激动。

早在上世纪80年代,刘志基还是古文字学研究生时,厚厚的《说文解字》被他翻烂了两本。同时,必备的学习工具还有放大镜和毛笔。“字太小了,拓片也很不清晰,只有依靠放大镜才行。至于毛笔,也是研究古文字的人所必需的,因为经常需要自己临摹。”

在刘志基看来,古文字专业,长期以来是在一个非常“原始”的文字处理平台上进行研究和各种应用,靠手抄来进行文字传播的状况,让大家当时就意识到很多问题:和其他专业比较,平台落后很多,也不够规范,同时,正是没有很好的平台,致使研究成果的查询存在诸多障碍,很多学者也因此走过很多弯路。

过去,业内有一句行话:为查一书走遍天下,为查一字翻遍全书。对于个中甘苦,刘志基是亲历者。“当连信息都找不到的时候,学习和研究就是奢谈,麻烦和困扰,不言而喻。因此,古文字学的教学模式,就是师傅带徒弟。”

上世纪90年代起,随着计算机技术的发展,华东师范大学中国文字研究与应用中心瞄准了一个方向,就是必需建设数据库,做专业的中国文字数字平台。

智能型数据库传承“冷门绝学”开始一步一个脚印踏实走起,由古文字和计算机的专业研究团队联合联手攻关。

以往历代出土实物文字材料的用字,大面积未被国际标准字符集覆盖,与此同时,约7万虽已进入国际标准字符集中的文献用字,却也存在网络使用障碍。前者“缺字”,后者却不能“使用”。

在对海量文献用字逐一整理的过程中,研究团队研发了完整的出土实物文字字符集标准体系,覆盖数据库使用所有字符的有效输入检索手段,这样,就能保证库内所有字符与标准码位的一字一码精确对应,保证数据库各种资料都处于有效的数字化处理范围之内。

刘志基介绍,此次,最新将“古文字智能识别系统”与“中国文字数据库”关联组合,正是为了推动古文字图像识别走出“抽象识字”的局限。同时,消除数据库的使用盲点,还可以实现数字平台中图片载体材料与字符集载体材料的自动数字关联,营造出古文字资料大数据生成和机器识读的环境。

“中国文字数字平台”已被打造成智能型古汉语文字的数字平台,迄今为止,智能检索数据库所包含的文字材料,覆盖了自殷商到明清整个汉字发展史上各种时段、各种类型的文字。先秦部分基本囊括了目前已公布的文字资料,先秦以后部分则汇集了各时段代表性的文字资料。

◆ 冷门绝学 

   青年学者学生“接棒”传承

在刘志基看来,“冷门绝学”从长期来讲,确属“小众”,但客观来说,近一二十年不断有新的古文字材料公布,这就会形成一个个“学术热点”。因此,“冷门”又不像原来那么“冷”,而教育部“强基计划”的实施,又为学界业界注入信心。

去年,随着教育部“强基计划”的落地,“古文字学”作为华东师大中文系本科的一个专业方向首次出现。迎接他们的,是在“中国文字数字平台”内,“强基计划智能助学系统”应运而生。

其中,“古文字智能图像识别”,能帮助当下当古文字学习者打通与古文字数据库之间的人机障碍;“虚拟仿真:能走进商周古文字”,帮助“强基”学生成功“穿越”到殷商时代的社会文化环境中,将文化、历史、思想等多方面知识点融入商周古文字三维场景的讲解过程……

如此现代而优渥的学研平台,让前辈们很是期待00后们日后的闪光和建树。这批学生入校后,刘志基多次和他们说,作为年轻的一代而且没有成见的一代,古文字学可能是未来“最好玩”“最宝藏”的一门学问。如此言说,归根结底还是原本对其研究和开发都太不够了,就像面对一片蓝海,值得注入最大的热情和定力。

刘志基还和同学们开玩笑地说,即使不做深入研究学问,做文创也行啊。“如果要寻找中国元素,古文字无疑是最丰富的载体。”

除了古文字学本科生队伍的出现,一些青年学者已更真切地感知“接棒”传承的意义。

就在前几天刚通过博士后进站答辩的青年学者徐丽群感到,一旦沉下心,认真研究进去,就能够发现无穷乐趣,古文字的世界内涵太丰富了,越做下去,就可能越有“上瘾”之感。伴随而生的是,青年学人的使命感。“特别是知道前辈老师们过往治学的艰辛后,就更觉得坚持和传承的意义。不然,以往前辈们累积下来的一些研究成果就真的断代了。”徐丽群感慨道。

正如华东师范大学中国文字研究与应用中心主任臧克和所说,古文字是中国文化的重要载体,文化之寻根,传统之溯源,均离不开对古文字的解读和研究。如今,数字平台同时面向社会公众开放,就具有了公共性平台属性。对于社会公众而言,也只有了解了汉字产生、变化的过程,理解汉字的真实含义,才能产生对汉字以及中华文化的认同。

青年报·青春上海记者 刘昕璐/文 施培琦/图、视频(除署名外)

编辑:梁文静

来源:青春上海News—24小时青年报

返回上页 回到首页

青年报社 版权所有

广告热线:021-61173717 | 违法和不良信息举报电话:021-61177819 / 61177827 举报邮箱:services@why.com.cn    测试版