中文一体化医学语言系统

参会人员:刘杰,江思源,李雨龙,明鉷,肖勇博,韩朋,殷越

请假人员:姚小慧,严金戈,陈绪,王雨婷,唐晨,景波

UMLS(一体化医学语言系统)是指在一个知识系统中将一些情报语言进行统一控制,使得相关的概念得到集中展示。中文一体化医学语言系统(CUMLS)中国医学科学院信息研究所开发研制。

CUMLS主要由词表构建与维护平台、医学词表、语义网、词表服务平台组成。

医学词表由10余个文档组成,逻辑上分为概念名称文档、来源词表和任务文档。概念名称文档是所有文档的核心,承担着连接各来源词表及语义网的作用。概念名称文档以主题概念为核心进行组织,包括概念的中文名称、语义类型、文档信息等内容。来源词表文档记录了各来源表的完整信息,保留了来源表的数据结构、内容、关系和属性,采用统一元数据格式描述。任务类文档为完成特定任务而构建。如为提高计算机自动标注效果,建立了特征词词典、副主题词词典、禁用词词典,以解决医学常用词或高频词对主题概念自动标注产生的噪音。

于以往主要包含语义类型和语义关系。语义类型是一组较为宽泛的主题类目,按实体和事件进行组织,按等级结构排列,提供医学词表中所有概念的统一范畴或类目组织。语义关系,用于揭示各语义类型之间可能存在的重要关系,包括等级关系和相关关系

CUMLS 构建流程主要包括素材整理和词表整合两部分。素材整理包含建立主题词表医学语料等词表。词表整合,是通过建立概念名称文档和语义网, 实现多个词表之间的关联整合,形成自然语言、主题语言、分类语言的融合和概念间丰富的语义关联。

anyShare分享到:
This entry was posted in 例会. Bookmark the permalink.

发表评论