第A02版:要闻

上一版  下一版   

 

2021年06月07日 星期一

 
 

放大  缩小  默认    下一篇

 

50后靠“三件宝”00后只需一“脑”

青年报记者 刘昕璐

50后的刘志基,在上世纪80年代学习古文字时,必备的“三件宝”是一本《说文解字》、一把放大镜和一支毛笔。00后的宋楚莹,如今在学习古文字时最重要的学习工具是一台可以联通“智能检索中国文字数据库”的电脑,即使完全不认识,也可以靠强大的后台数据库“按图索骥”。曾经“为找一书走遍天下,为查一字翻遍全书”的艰辛,自然已是很难想象了。历代千万文字可智能识别,如此大环境的改善和发展的背后,正是高校通过研发智能型数据库传承“冷门绝学”的那份努力和成效。青年报记者 刘昕璐

直观一课:“热搜”溯源古文字

不久前,一名书法家认为“颜真卿写错了字”的事件在网上发酵,这引起华东师范大学“古文字学(强基计划)”大一学生宋楚莹和小伙伴们的探讨兴趣:“刺史”的“刺”,颜真卿为什么写成“刾”?

学校老师抓住这个契机,运用“智能检索中国文字数据库”给同学上了直观一课。

老师们先引导同学进入“石刻智能检索数据库”,运用该数据库嵌入的“石刻疑难字形智能识别器”,识别出唐代文字中貌似“刾”的那个字,识别结果,让同学们了解,当时的“刺”大概率写成“刾”。而这个“刾”中的“夹”,就是“朿”的自秦汉文字以来的变形。

继而,老师又引导同学进入“甲骨文智能检索数据库”,运用其嵌入“甲骨文智能镜”识别甲骨文的“朿”,进入“商周金文智能检索数据库”,运用其嵌入“商周金文智能镜”识别商周金文的“朿”,进入“战国楚简文字智能检索数据库”,运用其嵌入的“楚简文字智能识别器”识别战国楚简的“朿”。最终,同学们了解到:“朿”字之形,取象于“树木的刺芒”,正是先秦时代的“刺”。

同学们的这次查证借助的正是华东师范大学利用图像识别工具与数据库结合创建的智能型“中国文字数字平台”,该平台现已取得重大成果,殷商甲骨文、商周金文、战国楚简等,那些出现在铜器、竹简、石刻等材料上超过1000万个历代出土实物文字、可搜集到的文字,都以文字和图像全数字化的形式收入平台,继而可以运用数字化方式来处理和研究。

类似使用网上购物平台“扫一扫”功能就能出现对应的物品购买通道,数字平台里的“智能镜”就能帮助使用者“按图索骥”,迅速查到“字海”,查出这是什么字,原始出处为何。

记者了解到,提供覆盖整个汉字发展史的相关文字信息的检索查询,这项横跨中国文字学与计算机科学等学科的新文科建设新成果的运用,其背后是“冷门绝学”百余人团队20多年磨一剑,营造出3000年汉字数字长城。

今昔对比:研究环境天壤之别

看着当下00后学生学习古文字专业的环境如此便捷,华东师范大学中国文字研究与应用中心副主任刘志基满是感慨和激动。

早在上世纪80年代,刘志基还是古文字学研究生时,厚厚的《说文解字》被他翻烂了两本。同时,必备的学习工具还有放大镜和毛笔。“字太小了,拓片也很不清晰,只有依靠放大镜才行。”

过去,业内有一句行话:为查一书走遍天下,为查一字翻遍全书。对于个中甘苦,刘志基都是亲历者。“当信息都是找不到的时候,学习和研究都是奢谈,麻烦和困扰,不言而喻。”

上世纪90年代起,随着计算机技术的发展,华东师范大学中国文字研究与应用中心就瞄准了一个方向,就是必需建设数据库,做专业的中国文字数字平台。

智能型数据库传承“冷门绝学”就开始一步一个脚印踏实走起,由古文字和计算机的专业研究团队联合联手攻关。

以往历代出土实物文字材料的用字,大面积未被国际标准字符集覆盖,与此同时,约7万虽已进入国际标准字符集中的文献用字,却也存在网络使用障碍。前者“缺字”,后者却不能“使用”。

在对海量文献用字逐一整理过程中,研究团队研发了完整的出土实物文字字符集标准体系,覆盖数据库使用所有字符的有效输入检索手段,这样,就能保证库内所有字符与标准码位的一字一码精确对应,保证数据库各种资料都处于有效的数字化处理范围之内。

刘志基介绍,此次,最新将“古文字智能识别系统”与“中国文字数据库”关联组合,正是为了推动古文字图像识别走出“抽象识字”的局限。同时,消除数据库的使用盲点,还可以实现数字平台中图片载体材料与字符集载体材料的自动数字关联,营造出古文字资料大数据生成和机器识读的环境。

“中国文字数字平台”已被打造成智能型古汉语文字的数字平台,迄今为止,智能检索数据库所包含的文字材料,覆盖了自殷商到明清整个汉字发展史上各种时段、各种类型的文字。先秦部分基本囊括了目前已公布的文字资料,先秦以后部分则汇集了各时段代表性的文字资料。

冷门绝学:青年学者“接棒”传承

在刘志基看来,“冷门绝学”从长期来讲,确属“小众”,但客观来说,近一二十年不断有新的古文字材料公布,这就会形成一个个“学术热点”。

去年,随着教育部“强基计划”的落地,“古文字学”作为华东师大中文系本科的一个专业方向首次出现。迎接他们的是,在“中国文字数字平台”内,“强基计划智能助学系统”应运而生。

其中,“古文字智能图像识别”,帮助当下当古文字学习者打通与古文字数据库之间的人机障碍;“虚拟仿真:走进商周古文字”,帮助“强基”学生成功“穿越”到殷商时代的社会文化环境中,将文化、历史、思想等多方面知识点融入商周古文字三维场景的讲解过程……

如此现代而优渥的学研平台,让前辈们很是期待00后们日后的闪光和建树。这批学生入校后,刘志基多次和他们说,作为年轻的一代而且没有成见的一代,古文字学可能是未来“最好玩”“最宝藏”的一门学问了。如此言说,归根结底还是原本对其研究和开发都太不够了,就像面对一片蓝海,值得注入最大的热情和定力。

刘志基还和同学们开玩笑地说,即使不做深入研究学问,做文创也行啊。“如果要寻找中国元素,古文字无疑是最丰富的载体。”

除了古文字学本科生队伍的出现,一些青年学者已更真切地感知“接棒”传承的意义。

就在采访的前两天刚通过博士后进站答辩的青年学者徐丽群感到,一旦沉下心,认真研究进去,就能够发现无穷乐趣,古文字的世界内涵太丰富了,越做下去,就可能越有“上瘾”之感。伴随而生的是,青年学者的使命感。“特别是知道前辈老师们过往治学的艰辛后,就更觉得坚持和传承的意义。不然,以往前辈们累积下来的一些研究成果就真的断代了。”徐丽群感慨道。

[记者手记]做新时代的追梦人

最近,习近平总书记在给《文史哲》编辑部全体编辑的回信中说,增强做中国人的骨气和底气,让世界更好认识中国、了解中国,需要深入理解中华文明,从历史和现实、理论和实践相结合的角度深入阐释如何更好地坚持中国道路、弘扬中国精神、凝聚中国力量。他希望广大哲学社会科学工作者在新的时代条件下,推动中华优秀传统文化创造性转化、创新性发展。

上海高校的研究者们就是在做这样的工作。他们并不仅仅在传承“冷门绝学”,而是难能可贵地进行了创新性研究和创造性继承。古文字是中国文化的重要载体,文化之寻根,传统之溯源。作为烛照中华民族上千年的人文之光,今天依旧给我们底气和力量。

人文浸润科技,科技赋能人文。做新时代的追梦人,就是既要有人文情怀的涵养,也要有对科学精神的追求和崇尚。

青年报记者刘昕璐

 

 

青年报