“Ontology Driven Decision Support System Architecture for Gait Analysis”文章翻译

 

                                   用于步态分析的本体驱动的决策支持系统架构

摘要:本文给出了在构造过程和医学数据仓库架构中领域本体的作用以及基于给定本体的决策支持系统。描述的邻域的是下肢骨骼肌系统的部分。在本文中,我们预先设定一种如何将通用数据挖掘方法和数据仓库模型以及领域本体相结合的方式来构建用于步态分析的智能系统。本文描述了下肢特定的领域本体和如何映射到数据仓库的方式以及决策支持系统产生的步骤。

关键词:数据仓库,本体,专家系统,下肢,数据挖掘

Ⅰ介绍

在一些基于大数据仓库查询的决策支持系统中知识表示和结果解释是非常重要的问题。现有医学领域通过丰富的专家知识来表征而且实际上它的每个特定领域都有一个不断发展且互相作用的相关指南。一个长期的目标是通过使用支持医疗决策系统的知识表示形式。这些领域之一是步态分析或者在我们的例子中下肢骨骼肌系统。在构建过程中,我们探索的方法和工具有效地结合普通数据挖掘方法作为基础方法来应用。到目前为止,只有很少的研究是关于基于本体的数据仓库模型的系统开发和只有一个关于下肢骨骼肌系统的本体设计。但是,这些研究给出针对人类步态特定领域的完整数据仓库描述和数据挖掘构建过程。依然没有回答的问题之一是在方法和模型中本体的作用。由于这个想法在本体背景下重复使用,因此我们选择现有的本体作为我们工程引用。本文给出了基于普通数据挖掘方法和数据仓库的领域本体的结合。我们的方法包括个别类别的人口统计数据(分类,数字数据)和时间序列(人的步态变量,实验特定变量等)(关节,肌肉[1,2,3])。

Ⅱ本体论背景

本体是在一个邻域中一个概念和语义、智能关系的一种明确的结构化的规范,这里的语义化也是真实现象的抽象模型。今天本体在医学中的使用,我们主要关注医学专有名词的表述和组织。医生开发他们自己特定的语言和词汇来帮助他们存储和交流普通医学知识和与病人相关的信息。像这些对人工处理最有效的专有名词可以通过一些隐性知识来表征。另一方面,医学信息系统需要可以毫不含糊地交流复杂的、细节的医学概念[1,4]。这个困难的任务可以通过构建医学领域的本体来表示医学名词来完成,如GALEN[4,5]。这个医学术语、解剖学和药物的大的本体可以被转译成OWL(本体WEB语言)且它的大小约为20MB。OWL是当今使用最广的标准本体语言,同时它是基于XML格式的。因此,从人工智能的角度来看,本体论不仅是一门学科,也是本体分析和建模行为的输出。这是为什么我们可以说“下肢本体论”的原因。这个本体是所谓的邻域本体的例子,然而“功能本体”表示独立领域概念,像对象,事件,过程。一些使用本体的好处是:互操作性,重复利用,数据和知识的整合和共享。关于本体对于真实系统的设计和维护的影响存在怀疑。考虑到医学本体的大小和复杂性,我们看到了关于大的本体的设计和维护的问题。这是为什么我们关注于本体驱动领域的原因。我们研究OSMMI(Ontologie du Systeme Musculo-squelettique des Membres Inferieurs))作为我们生物力学实验室项目的本体,如GALEN和其它复杂本体[1]。

Ⅲ提出的结构方法

决策支持系统构建有多种方法。由于我们的目标是用于步态分析的数据挖掘系统,我们以通用数据挖掘方法开始,其由下边七个步骤组成:(1)明确的定义该问题(2)定义数据模型和数据需求(3)从一切有用仓库中提供数据和进行数据准备工作(4)评估数据质量(5)选择挖掘方法和定义挖掘运行(6)理解结果和提取新的信息(7)应用结果和新的知识。

依照上述方法,我们定义一个关于关节损伤的步态失调问题。这一步更倾向于更具体的问题和覆盖面更广的下肢骨骼肌系统领域的数据仓库。第二步,我们研究了基于医学领域本体的现有概念数据模型。关于我们在步态分析图1方面领域和兴趣,我们发现提出模型的肌肉、骨骼和神经的数据事实更有趣些。Fig.1中给出骨骼肌系统的概念数据模型事实表和相关维度。在步态分析中,这不是最佳解决方案,因为额外的工作是需要整合多个事实表,而且由于对每个系统存在多个事实表使查询变得更加困难。在Fig.1中提出的模型也已经非规范化、粗 粒度地获得事实表,其不适合于大量的时间序列的存储。

 

在我们的例子中,平均读取包含在一20秒的周期运动过程中以10ms周期采样的10个不同参数,在这一过程中,对一个运动模式产生约20000个样本,包括5个步骤,在分析中无需额外时间和人口规模。数据仓库是一种时间模型,其测量量被组织、收FIG2集并表示为事实,保存到事实表中。在一个给定情况下,这种结构方法可以解释测量量[7]。当使用不同维度来丰富如时间,人口和人体测量参数,词汇等时,事实就会变的更加有意义。当在步态分析中使用的chorons被置为毫秒尺度时,提出的骨骼事实表就会变为对缓慢变化的维度表的候选。本体是数据模型有用的输入且它给出了可能性分享的信息结构的普通理解,同时允许隐性知识的复用。尽管基于一种本体的现有模型不满足步态分析需求,因为它太普通了。在构建过程中,我们使用一些来源于OSMMI的想法,但我们根据其他本体的模型。OSMMI类以及它们之间关系用UML(Unified Modeling Language)表示如图Fig2[1]。

OSMMI包括14部分(类)。它们包括:神经系统,韧带,肌肉,肌腱,软骨,骨,四肢,姿势,支持负载,Diarthrosis关节,运动时,关节接触,环境接触和步态。OSMMI语义关系总结如下表1 [1]。TABLE1

 

为了更好的理解,将类分为子类,同时对步态分析的每个个体分类。语义是以不同关系为基础的,使它更适合于在传统关系数据库中实现。在事实表中,典型的数据单元包含了一些从实验中测量的变量,包括肌肉,骨头,地面反作用力等。在我们的方法中,我们初始包含所有变量,其是在一张大的事实表中典型实验的一部分。这种方法的判定是,在实际中数据是基于时间序列的,并且附加信息存储在缓慢变化的维度中,就像实验,它可以保存描述性信息(在操作之后,它也可以是人工髋关节)一样。对于维度表,本体类是所有的候选量。初始,这种方法创建星状结构,但是我们需要记住,本体是从类中形成的,这些类中有像后纵韧带(其有两个子类:arched poplity, oblique poplity),(膝盖骨副韧)patellar aileron (其依然包含两个子类:patellar external aileron, patellar internal aileron)这样的子类,同时这些类构成雪花架构(snowflake schema)。所有这些数据可以被导出和概念化到本体上得到基于人体的这些类别,功能和行为的数据维度。仿真模型可以基于元数据和数据仓库的方法来推断出。人体步态的一个重要方面是通过相关的标记触诊,学习人体结构和他们位置之间的关系。这个检测简化了相关知识,观察和触诊去判定或确定诊断的任务。数据和信息的语义化在数据库和数据仓库的逻辑和智能设计中具有一定的作用,其中对于这个系统的信息被描述为一个清单目录[8]和资产(翻译问题??)。两种类型的系统被解释为:基于机器(从本体的角度)和自然系统,如人体解剖。综合人体解剖学[9]是一种连接实体或维度的自然内置系统。类似于实体,维度可以描述,概念化这种关系。这些相关的数据维度通过本体来概念化,同时存储为元数据。从现实世界的维度大小可以通过存储的元数据的本体来解释,如示图Fig3[6]FIG3

数据源和预处理由识别、收集、滤波和聚集(原)数据为数据模型需求的格式几个阶段组成。数据模型评估需要对选择的变量进行验证,处理异常值、缺失值和移除多余变量。基于ETL(Extract Transform and Load)的本体论是一个处理这两个步骤的工具。有许多论文推荐本体论作为选择合适数据挖掘的工具,这是选择选择数据挖掘函数步骤的部分。从执行任何一类数据挖掘的结果都可以给出了丰富的信息,这些信息有时很难解释,这种解释通过存有本体的元数据完成。在许多情况中,数据挖掘生成我们称为模型的数据数学关系。这些模型非常重要,因为它们不仅提供对病人深入的了解,而且它本身可以部署在其他系统,或被其他系统(再)使用。

Ⅳ讨论和总结

尽管在决策支撑系统构建过程中,如术语标准化,知识分享和复用,数据仓库模型验证和支持知识和数据的不可或缺的整合,使用本体有许多明显的优势,但从业者还需要集中于特定领域。在一周内,我们可以构建基于OSMMI的数据仓库模型,同时避免许多有关数据要求和模型的问题。我们的模型有3个事实表,18个维度表(基于本体类,4是缓慢变化的维度)和附加的元数据表。我们在ERL、数据细化和结果解释中重复使用本体。OWL是流行的XML基础语言,它结合了XSLT(Extensible Stylesheet Language Transformations),其能够自动产生维度表,元数据和事实表的架构。元数据和维度表也可以自动地用隐含存储在OWL中的关系填充,来达到结果解释的目的。但是我们已经发现本体论的最大优势是在ETL和结果解释方面。

anyShare分享到:
This entry was posted in 学习笔记. Bookmark the permalink.

发表评论