发布古籍整理数字资源45亿字
2025年10月28日   00:11 | 来源:光明日报

  日前,中华书局古联公司成立十周年暨古籍智能化建设与应用高端论坛在京举行,来自全国高等院校、图书馆、出版机构的百余位专家学者出席。会上介绍了古籍数字化的多项成果,目前古联公司发布的数据库产品资源规模已达45亿字,构成国内规模最大的线上整理本古籍资源库。


  据介绍,十年来,古联古籍数字化产品矩阵以专业整理本古籍为核心,同时陆续推出了“中华石刻数据库”“历代进士登科数据库”“木版年画数据库”“殷墟甲骨文数据库”“小学文献数据库”等专题数据库,共涵盖专业古籍整理出版资源27.5亿字,学术资源2.8亿字,普及资源3亿字,石刻文献7万余篇,文史工具资源150余万条,历代登科人物10万余条,甲骨文卜辞14万余条,木版年画18000余幅,书法作品10000余种,其他专题性典籍资源3亿字,资源类型与规模均居行业首位,为用户提供了高质量的内容和丰富的选择空间。此外,古联公司还发布有近代报刊文献资源7.4亿字,口述史视频1300分钟,档案60000余幅,为近现代研究提供了有效支持。古联公司古籍大数据中心对上述数据资源均进行了精细化加工与结构化标引,并基于机器深度学习技术推出古籍智能整理平台,实现了文字录入、断句标点、繁简转换、专名识别、文白翻译全流程自动化,将古籍出版从“人工点校”升级至“人机协同”新阶段。


  中华书局总经理助理、古联公司总经理洪涛说,以前的“古联”代表着汇聚古籍资源的“古籍联合”,未来的“古联”要实现“聚古联今”,让古籍内容融合现代生活。(记者陈雪)


(责任编辑:宗元)
分享到:
分享到微信朋友圈 ×
打开微信,点击底部的“发现”,
使用“扫一扫”即可将网页分享至朋友圈。
免责声明:
凡本网注明“来源:XXX(非中国文信网)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。如因作品内容、版权和其它问题需要同本网联系,请在相关作品刊发之日起30日内进行。