大众阅读福音:吾与点系统免费开放,轻松实现古籍活化传承

2025-06-11| 1160 阅读
古籍,作为中华文明的基因库,承载着千年的智慧与记忆。然而,由于历史的变迁和技术的限制,许多古籍面临着难以阅读、难以传承的困境。但随着人工智能技术的发展,古籍活化传承迎来了新的曙光。北京大学数字人文研究中心研发的 “吾与点系统”,便是这样一款具有突破性意义的产品。它的免费开放,为大众阅读古籍提供了前所未有的便利,堪称大众阅读的福音。

? 吾与点系统:古籍活化传承的智能引擎


吾与点系统是北京大学数字人文研究中心针对古籍文本推出的 AI 驱动云端智能标注平台。它利用先进的 AI 技术,为用户提供智能化的古籍文本标注服务,能够自动识别、分类和标注文本中的实体和关系,大大提高了标注的准确性和效率。经过大量古籍训练的 AI 模型,不仅能为用户提供句读、分词等高级功能,还能帮助用户更好地理解和分析古籍文本。

该系统的功能十分强大,包括实体标注、关系标注和图谱生成。实体标注支持手动、正则匹配、AI 识别三种模式,能够快速准确标注古籍文本中的实体,轻松应对大规模文本。关系标注则简化了标注过程,易于上手,便于操作,精准捕捉古籍文本中实体间的复杂关系。图谱生成功能更是能够自动将标注的实体和关系转化为清晰的知识图谱,优雅便捷,并且支持多种常用工具格式的输出。

? 技术优势:让古籍整理更高效


吾与点系统在技术上具有诸多优势。首先,它采用了基于深度学习的预训练语言模型 BERT,并利用 10 亿字的古汉语语料对其进行增量训练,从而使模型具有更好的古汉语表示能力。在句读功能上,该系统利用互联网上公开的古籍文本库训练得到,训练集包括 7 亿字,无论是先秦典籍还是明清小说,模型在混合类文本测试集上的句读平均准确率超过 94%,标点准确率达 90%,达到了实用标准。

其次,吾与点系统的自动分词模型可实现对上古、中古、近古以及现代汉语文本的分词,在四个时代的分词平均 F1 值达到 98%。在专有名词识别方面,经测试,现有模型在与训练语料同类型的测试语料上,其准确率达到 98.5%。在《尚书》《春秋》等先秦上古语料上对人名、地名的泛化准确率分别达到 87% 和 82%,在明清小说上测试识别准确率达到 80%。这些数据表明,当前基于预训练模型的深度学习方法在中华古籍文本上的句读和专有名词识别已经取得与专业人员相媲美的表现。

此外,吾与点系统还具有极高的处理速率和响应速率,经测试 API 接口处理 5 万字耗时 10 秒左右。这使得用户能够快速高效地完成古籍整理工作,大大提高了工作效率。

? 应用案例:让古籍走进大众生活


吾与点系统在实际应用中取得了显著的成果。例如,在《宋元学案》知识图谱项目中,团队通过对文本中人物、地点、时间、著作、思想等内容的提取,将思想家们的师承关系、生平事迹、活动轨迹、具体思想观点等通过可视化的手段绘制成知识图谱,使得普通读者也可以在短时间内对宋代、元代的学术发展建立起总体性认知。

另外,吾与点系统还与字节跳动合作研发了 “识典古籍” 平台,这是全球规模最大的古籍数字化公益阅读平台和智能整理平台。该平台将北大数字人文中心在古籍智能信息处理的技术积累转化为面向大众的公益性社会服务,让更多的人能够轻松阅读和整理古籍。

? 免费开放:普惠大众的重要举措


吾与点系统的免费开放,是普惠大众的重要举措。它打破了传统古籍整理的门槛,让更多的人能够参与到古籍活化传承的工作中来。无论是专业学者还是普通读者,都可以通过该系统轻松完成古籍的句读、分词和实体标注等工作,从而更好地理解和研究古籍。

对于专业学者来说,吾与点系统能够大大提高他们的研究效率,节省大量的时间和精力。他们可以将更多的时间和精力投入到对古籍内容的深入研究中,而不是花费在繁琐的整理工作上。对于普通读者来说,该系统能够帮助他们更好地阅读古籍,理解古籍中的内容,从而提高他们的文化素养和阅读兴趣。

? 未来展望:开启古籍活化传承新纪元


吾与点系统的免费开放,标志着古籍活化传承进入了一个新的阶段。随着技术的不断发展和完善,吾与点系统有望在以下几个方面取得更大的突破:

一是进一步提高系统的准确性和效率。通过不断优化模型和算法,提高句读、分词和实体标注的准确率,同时进一步缩短处理时间,提高系统的响应速度。

二是拓展系统的功能和应用场景。除了现有的实体标注、关系标注和图谱生成功能外,还可以开发更多的功能,如文白翻译、古籍注释等,以满足不同用户的需求。同时,还可以将系统应用到更多的领域,如教育、文化旅游等,让古籍更好地服务于社会。

三是加强与其他机构和平台的合作。通过与图书馆、博物馆、出版社等机构的合作,整合更多的古籍资源,建立更加完善的古籍数据库,为用户提供更加丰富的古籍内容和服务。同时,还可以与其他智能平台进行对接,实现数据共享和协同工作,提高古籍活化传承的整体水平。

总之,吾与点系统的免费开放,为古籍活化传承带来了新的机遇和挑战。相信在不久的将来,随着技术的不断发展和完善,吾与点系统将在古籍活化传承领域发挥更加重要的作用,让更多的人能够领略到中华古籍的魅力,为传承和弘扬中华优秀传统文化做出更大的贡献。

该文章由dudu123.com嘟嘟 ai 导航整理,嘟嘟 AI 导航汇集全网优质网址资源和最新优质 AI 工具。

分享到:

相关文章

创作资讯2025-03-21

笔灵 AI 学生版使用教程:2025 最新降 AI 痕迹方法

🛠️ 笔灵 AI 学生版使用教程:2025 最新降 AI 痕迹方法 📝 一、为什么要降 AI 痕迹? 现在的论文检测系统越来越智能,像 Turnitin、知网这些平台,不仅能查重复率,还能揪出 A

第五AI
创作资讯2025-03-26

告别机翻式降重 | 掌握地道表达,让你的英语论文更专业

很多同学写英语论文时,为了降重会直接用翻译软件把中文翻成英文,再稍微改改就提交。但这种 “机翻式降重” 其实藏着大问题 —— 看似重复率降下去了,可论文读起来生硬又别扭,甚至会出现逻辑断层,反而让审稿

第五AI
创作资讯2025-05-02

第五AI vs. 传统检测工具:为何说它是提升内容效果的生产力产品?

现在做内容创作,谁还没被 AI 检测工具坑过?辛辛苦苦写的稿子,被传统工具误判成 AI 生成,要么就是明明是机器写的内容,却能轻松蒙混过关。这事儿放在两年前可能不算大问题,但现在各平台对 AI 内容的

第五AI
创作资讯2025-03-06

探讨AI写作的边界:哪些类型的公众号文章最适合用AI完成?

📰 资讯整合类:数据驱动的事实性内容​对于每天需要更新大量行业动态、热点新闻的公众号来说,AI 在资讯整合方面的优势简直肉眼可见。这类文章的核心是客观事实的罗列与梳理,不需要太多主观情感的注入,正好

第五AI
创作资讯2025-05-15

AI降重如何做到不改变原意?核心技巧与工具选择

🛠️ 搞懂 AI 降重的底层逻辑:为啥原意总跑偏? 做内容的人都知道,AI 降重最头疼的不是改文字,是改完之后意思变了样。明明只是想换种说法,结果核心观点被稀释,甚至完全反过来。这问题出在哪?得先从

第五AI
创作资讯2025-06-26

2025 日语能力考新趋势:动漫学习如何助力 CEFR 标准提升

动漫作为一种深受年轻人喜爱的文化形式,不仅能够带来娱乐享受,还能在日语学习中发挥重要作用。特别是在 2025 年日语能力考(JLPT)改革后,考试成绩将与欧洲共同语言参考标准(CEFR)挂钩,这为动漫

第五AI
创作资讯2025-06-21

标小兔 AI 写标书 2025 最新版:智能算法生成高质量投标文件教程

? 标小兔 AI 写标书 2025 最新版:智能算法生成高质量投标文件教程 现在市面上有很多 AI 写标书的工具,标小兔 AI 写标书 2025 最新版凭借其智能算法生成高质量投标文件的能力,在众多工

第五AI
创作资讯2025-07-04

如何通过欧盟 MRP 数据库筛选活性成分?多语言 PDF 下载助力法规合规

? 欧盟 MRP 数据库基础认知与访问入口 要通过欧盟 MRP 数据库筛选活性成分,得先搞清楚这个数据库的定位。MRP 全称是 Mutual Recognition Procedure,也就是互认程序

第五AI