3.7万人通过AI平台完成15亿字古籍粗校,过去需穷极一生的工作被技术改变 当古籍整理遇上AI

来源:工人日报编辑:杨焯兰发布时间:2026-02-01 查看数0

阅读提示

全国2万名大学生与1.7万名社会志愿者,正通过AI平台协同校对古籍。从《永乐大典》精校到《康熙字典》生僻字识别,AI将古籍整理效率提升数十倍,更让机场工作人员、敦煌学博士生在“故纸堆”里相遇。技术正为传统文化打开一扇属于数字时代的大门。

近日,由全国高等院校古籍整理研究工作委员会主办,北京大学中国语言文学系古典文献教研室、北京大学数字人文研究中心与字节跳动公益联合承办的“数智时代古籍数字化前沿论坛暨‘我用AI校古籍’(2025年)总结会”在北京举行。

《工人日报》记者了解到,“我用AI校古籍”项目自2024年启动以来,在“识典古籍”智能整理平台支持下,吸引了全国1450余所高校的2万名大学生及1.7万名社会公众志愿者参与,累计完成15亿字的粗校,约覆盖2万部古籍,显著降低了古籍整理的专业门槛,激发了公众对优秀传统文化的传承热情。当古籍整理遇上AI,会迸发出什么样的火花?

突破传统人力局限

我国古文献学历史悠久,从汉代开始就有把目录、版本、校勘融为一体的校雠学。简单来说,古籍整理就是选定某一个具有代表性的版本为底本,通过和其他版本的校勘,再对它加以现代的标点、标注等,最终提供一个文字准确、标点可靠、方便阅读的排印版本。

传统的古籍整理依赖于人工,耗时耗力,在20世纪80年代开始使用计算机录入文本,但这种方式速度依然慢,中间也会出现错误。北京大学中文系教授杨海峥坦言,这种录入错误,会增加后期的校勘和校对成本。

OCR技术即光学字符识别技术带来了改变。“光学字符识别技术成了古籍文字提取的核心工具,可以识别文字,给文本利用环节带来根本性的改变,并且它的准确率非常高。”杨海峥说。另外,过去学者们需要花大量时间来做的文本标点和专名识别工作,新技术也可以在短时间内完成,实现自动标点和分段。

“AI技术不仅大幅提高了古籍校对效率,还弥补了传统人力校对处理海量文献的局限,为古籍整理开辟了人机协同新途径。”全国高等院校古籍整理研究工作委员会秘书长卢伟说。

在杨海峥看来,AI也有助于多版本校勘。传统的校勘学者用手工比对各种版本,穷极一生进行校对工作,AI可以自动对齐历代版本,过滤形近字错误,并且生成结构化的校勘记录,“之后学者只需要去聚焦关键译文的判断和分析,梳理版本的源流,这就大幅度节约了校勘时间”。

让古籍被更多年轻人打开

方晓辰是首都师范大学历史学院敦煌学方向的博一学生,也是校对古籍的志愿者,她发现AI大大提高了整理效率。“比如在处理《康熙字典》中的复杂字形时,平台的图像识别功能可以精准捕捉笔画细节,配合在线字典数据库,几秒钟就能完成一个生僻字的录入和校对。”她说,“这种便捷性让原本枯燥烦琐的整理工作变得轻松有趣,也让我深刻感受到科技赋能传统文化传承的魅力。”

当方晓辰看着自己整理好的古籍陆续上线,在平台上被其他人引用讨论,“那种‘让沉睡的文字活起来’的满足感,是无法替代的”。

除了高校学生之外,社会公众也参与到古籍校对之中。AI技术不仅降低了古籍整理的技术门槛,让更多古籍爱好者能够参与其中,也让公众能够更加便捷地获取古籍中的知识。

在机场工作的社会志愿者张晓波说,虽然自己从事的行业与古籍并无关系,但自己从小就对历史和古籍感兴趣。他参与了针对现存《永乐大典》的精校整理,团队中的队友多是专业师生,“我开始接触之前从未接触过的领域,在仅仅八卷的精校中包含了诗词、列传、府志、祭文、历法,对古籍的热爱与求知欲,也在推着我不断进步。”

“它让‘古籍’这两个字,从一种遥远的、被玻璃罩起来的文化符号,慢慢变成可以被年轻人打开、可以被大家一起修整、可以在日常里反复相遇的东西。”拥有289万粉丝的抖音博主“子非秋月”如是说。

提供更多研究可能

“太白夜食昴,长虹日中贯。”这句诗来自李白的《南奔书怀》,清华大学文学院副教授唐宸根据诗句中的描写,研究李白与永王李璘的最后情况。在计算最后的逃跑时间和路线时,AI能够自己写脚本去处理问题,用可视化的图表去辅助结果的判断,生成一些数据,最后给出一个报告。“这个报告里面就跟我说了当时的季节、长江水路速度、驿站速度等信息,以及怎样可能会被追击、怎样会比较隐蔽。”唐宸说。

“数智时代给我们提供了丰富易得的资源、材料,以及材料之间的相互联系,从而带来了古籍整理的新技术、新流程,以及解析文本的新视角、新方式,这是机遇。”杨海峥说。AI不仅大幅度缩短了古籍学术研究周期,更为相关学者开展跨专业领域研究创造了更多可能。

北京大学历史学系教授罗新,很多年前读《水浒传》时,看到椰瓢这一南方事物在北方使用,很有兴趣,但没有条件去研究。通过AI,他搞明白椰瓢在唐初的北方是奢侈品,并发现“元明时代中原与华北各阶层皆喜用椰瓢饮酒”。

安徽大学教授耿传友承担国家社科基金项目“徽人别集”数据库建设,需要将252本徽州相关文人作品转化为数字资料。通过AI,数据库一期上线,仅仅用了5个月时间就完成了120余部古籍的整理。

内江师范学院古籍整理研究所所长马振君,开设了“智能古籍整理”课程,引导学生依托AI技术开展古籍整理实践,在实践中掌握古籍整理技能。

可以预见,当古籍整理遇上AI,将会为优秀传统文化的传承打开一扇属于数字时代的大门。(记者  赵昂)

网友评论

已有0人评论,0人参与
(请登录发言,并遵守相关规定)
    冰城新闻
    冰城新闻
    微信公众号
    微信公众号
    新浪微博
    新浪微博


    哈尔滨广播电视台 版权所有 地址:哈尔滨市香坊区华山路1号 邮编:150036 总机:0451-87996114-转各部

    互联网新闻信息服务许可证编号:23120180002 黑ICP备08003366号 网上传播视听节目许可证号:0811610 国新网许可证编号:2332007009