另外,保护古籍是一项专业程度较高的技术,许多古籍保护单位一度面临过资金短缺、人才供不应求等问题,导致古籍无法得到适宜的保存条件。
保护古籍,并不是简单的将其“入柜”。
儒学典籍《儒藏》延续世界儒学文明
北京大学的《儒藏》工程,是建国以来最大规模地系统整理海内外儒学典籍的一项基础性文化建设工程,旨在收集、整理、保存和传播儒学文献及其史料,收取的上千部典籍上起先秦,下迄清末,前无古人。发起人为著名哲学家汤一介先生,涵盖中日韩越四国500位学者,在2004年启动,顾问组汇集了国内顶尖学人,政界,学界高度关注。
《儒藏》工程分《儒藏》“精华编”编纂与《儒藏》全本编纂。《儒藏》“精华编”收录中国历史上最具影响力和代表性的儒学文献——包括传世文献和出土文献510种,以及韩、日、越三国历史上用汉文著述的儒学文献160种,编为339册。《儒藏》全本计划收书3500余种(含“精华编”),约10—12亿字,将基本囊括中、韩、日、越四国历史上有价值的儒学文献。2024年,全本《儒藏》编纂工作正式启动。
2002年11月8日北京大学《儒藏》学术研讨会第一次会议
北京大学副校长、哲学系教授、《儒藏》工程首席专家、《儒藏》编纂与研究中心主任王博曾说:“很多人有时候对儒家,包括对中国文化会有一个印象,说中国文化好像是静止的,怎么老是在重复过去的东西?其实不是。这些经典在后代不断被重新解释。因为要回应新的时代问题必须有创新,它是在传承中创新,在创新中传承。”
所以编纂《儒藏》的重要性,并不仅仅体现在保存上,更是要让学者、爱好者乃至普通人,能够对古籍里的知识内涵,进行充分的挖掘、研究和阐释。
不过,直接阅读像《儒藏》这样体量的古籍,就算是“精华编”,对于大多数来人来说,并非易事。所以使其数字化,能够让更多研究者、爱好者能够更加便捷、高效地检索、整理古籍。
近年来,除了加大对现有古籍保存技术的投入,专家和学者们渐渐地开始使用数字化技术来将古籍的内容存储在电脑或者云端等电子设备中,在对外展览或者研究时,用图像、文字代替实物,减少损坏的风险,并提升阅读效率。不少像字节跳动这样的科技公司,依托平台和技术禀赋,在非遗、文物、传统文化知识普及等,持续助力中华优秀文化遗产传承。
“识典古籍”为古籍整理提效
12月9日,北京字节跳动公益基金会向北京大学教育基金会捐赠人民币2500万元,用于支持北京大学《儒藏》工程,同时,通过数字平台“识典古籍”支持《儒藏》整理工作。
北京字节跳动公益基金会理事长张羽表示:“《儒藏》工程中的很多工作是可以在人工智能技术的辅助下被解决和提效的,我们希望通过‘识典古籍’智能整理平台助力《儒藏》数字化整理。”
“识典古籍”是由字节跳动和北京大学共同开发的一个免费开放的数字化古籍资源平台,结合了字节跳动的人工智能技术优势、产品研发能力及北京大学数字人文研究中心的学术能力。2022年4月,字节跳动启动了平台的建设,经过6个月的建设,在同年10月平台正式上线。
经过两年多的发展,“识典古籍”已经具有版式识别、自动标点、结构整理、校勘等涉及古籍整理的全流程整理功能。以《儒藏》为例,整理者可以将相关文献的影像上传平台后,由人工智能进行初步整理,专业人员进行校对及做出更有深度的学术判断,这样可以大大减少专家在基础性工作上投入的精力。同时,“识典古籍”还开发了协作整理的功能,支持以团队的形式开展工作。另外,对于爱好者和普通人,阅读古籍过程中,若遇到疑难字词,选中就会弹出《汉语大词典》《康熙字典》和《说文解字注》的相关辞典数据,帮助理解词义。
为方便海外读者阅读古籍,以及服务对外中文教学等场景,“识典古籍”还提供英文界面,以及部分常见古籍的中英文对照阅读。
用“识典古籍”阅读儒家经典《论语》
目前,“识典古籍”已上线超过 1万部古籍,并推出了分词检索、实体百科、古籍 AI 助手和可视化实体关系图等功能。
字节跳动近年来持续助力“古籍活化”
古籍是中华文明的重要载体,开展古籍项目是长期助力文化传承的延续。北京大学《儒藏》编纂与研究中心相关负责人表示,实现中华古老文明与前沿人工智能技术的深度结合,是全本《儒藏》工程的一大特色,它不仅将极大促进《儒藏》的编纂和传播,也将丰富和提升智能工具对儒家文明的知识储备和理解问答,推进中华文明智能体应用。