文章摘要:[目的/意义]探索能够实现基于词和实体的检索与知识挖掘的人文知识库构建方法。[方法/过程]以《资治通鉴·周秦汉纪》为例,对68卷60万字的文本自动分词与词性标注之后,人工标注文本中的人物、地点GIS、时间等实体信息,实现基于词和实体的全文检索和地图检索系统;利用同现信息,统计出人物关系与人物游历信息;进而使用TF-IDF方法,通过时间序列分析,挖掘出多事之秋、风云人物、风云之地等结果。[结果/结论]基于词和实体的深度信息标注,能够解决缺乏词界、同名异指和异名同指的检索难题,更可以为古籍多角度的知识发掘与知识服务提供基础支撑。
文章关键词:
项目基金:《信息记录材料》 网址: http://www.xxjlcl.cn/qikandaodu/2021/1217/2401.html
信息记录材料投稿 | 信息记录材料编辑部| 信息记录材料版面费 | 信息记录材料论文发表 | 信息记录材料最新目录
Copyright © 2018 《信息记录材料》杂志社 版权所有
投稿电话: 投稿邮箱: