【例会】Activity recognition on streaming sensor data

主持人:赵春阳

参会老师:杨矫云、安宁

参会学生:李雨龙、程坤、刘硕、丁会通、郭思伊、肖勇博、殷越、贵芳

时间:2019年10月9日

本次例会学习讨论了文章:Activity recognition on streaming sensor data

一、背景

普适计算技术的进步推动了用于收集活动信息的隐蔽、无线、廉价的传感器的发展,当与最先进的机器学习算法结合使用时,传感器对于各种应用程序的开发至关重要。应用领域之一是智能环境,其中活动信息用于监视和跟踪居民的功能状态。本文介绍的工作尝试对从现实世界的智能家居获得的离散二进制运动传感器数据进行在线AR。该方法基于在先前传感器事件的滑动窗口中编码的信息对每个传感器事件进行分类。

二、方法

本节详细讨论了工作中采用的窗口方法及其修改。让我们首先定义一些用于描述该方法的符号。令s1,s2,…,sN代表传感器事件的顺序。这些示例事件包含是运动传感器和门传感器事件,如从我们的智能家居测试平台之一收集的图1中的样本数据中所示。我们首先描述基本的传感器窗口化方法,然后进行修改。

2.1 传感器开窗

为单个传感器事件提供上下文的一种简单方法是考虑在其之前的传感器事件。形式上,序列s1,s2,… sN分为相等传感器事件数量的窗口S1,S2,…,SM,其中Si窗口由序列[si-Δs,si]表示。参数Δs的值根据实验环境而变化。通过经验过程得出。影响参数Δs的值的不同因素中包括跨不同活动持续时间的传感器事件的平均数量。频谱的一端是“离开家”之类的活动,这些活动是通过快速触发一小组传感器来定义的,而另一端是“睡眠”活动,该活动持续数小时,但通常会导致偶尔触发一个或两个传感器,如图1所示。2

 

图1.来自一个智能家居测试平台的一系列传感器事件的示例

一旦定义了传感器窗口Si,下一步就是将该窗口转换为捕获其信息内容的特征向量。我们通过构造一个固定维度特征向量xi来执行此步骤,该向量明确捕获第一个和最后一个传感器事件的时间,窗口Si的时间跨度以及窗口内不同传感器事件的简单计数。如果使用15个不同的传感器,xi的维数将为18。每个xi都用最后一个的yi标签标记Si中的传感器事件(si)。每个标签yi对应一个活动类。 xi和相应的yi的集合然后成为训练数据,该数据被输入到分类器中以区别性地学习活动模型。这将是我们的基础方法,我们将与之比较拟议的增强功能。

 

2.2 时间依赖性

时间上分散开的两个传感器事件可能位于同一窗口。为了减少此类传感器事件对决定最后一个传感器事件的结果的影响,我们针对每个传感器事件使用相对于上一个传感器事件的时间的基于时间的加权因子。

让{ti-Δs,ti-Δs+1,… ,ti}表示第i个窗口中传感器事件的计时。为了计算描述窗口的特征向量,我们考虑了每个传感器事件相对于ti的时间差异,特别是我们使用指数函数来计算权重。因此,传感器事件k在间隔Δs内对描述第i个窗口的特征向量的贡献为

3

χ的值决定影响的衰减率。图2显示了χ对衰减率的影响。

4

图2.χ对权重的影响

 

2.3 传感器依赖性

本文提出的工作使用传感器之间的基于互信息的度量,以减少来自非常不同的功能区域的传感器事件对定义窗口内最后一个传感器事件的特征向量的影响。互信息通常定义为度量两个随机变量相互依存的数量。如果Si和Sj是两个传感器,则它们之间的相互信息MI(i,j)定义为

5

其中

6

当当前传感器为Si且后续传感器为Sj时,总和项的值为1。如果两个传感器彼此相邻,从而触发一个传感器最有可能触发另一个传感器,则这两个传感器之间的相互信息将很高,并且如果两个传感器彼此相距较远,使得它们彼此之间不会经常在一起发生,那么它们之间的相互信息就会很低。

2.4 过去的背景信息

前面介绍的方法仅考虑了正在分析的当前窗口中的传感器事件,没有关于过去的信息被编码到特征向量中。有关上一个窗口中活动的信息或活动的先前发生是确定当前窗口中活动的重要因素。在我们的数据集中,某些活动具有明确定义的过去活动; “进入家”是此类活动的一个实例,只有在“离开家”活动之后才发生。因此,将过去的活动信息添加到在当前窗口中定义活动的特征向量中,将增强对当前窗口的描述。

可以简单地将上一个窗口的基础事实和先前发生的活动添加到当前传感器窗口中,我们通过两个步骤将其纳入我们的学习问题。第一步,分类器使用不包含过去活动信息的训练数据来学习活动模型。然后将每个训练实例输入到此活动模型中,以获得每个窗口对应于不同活动的概率。在第二步中,将紧接在前传感器窗口的这些分类概率与最近预测的活动(不是紧接在前窗口中的活动)一起附加到描述当前传感器窗口的特征向量。

2.5 动态窗口大小

我们使用概率方法来推导每个单个传感器事件的窗口大小。我们首先定义一个固定数量的窗口大小{w1,w2,…,wL},其中w1 = min {ws(A1),ws(A2),… ,ws(AM)}和wL =中位数{ws(A1),ws(A2),…,ws(AM)}。 ws(Am)对应于活动Am的平均窗口大小。w1和wL之间的中间窗口大小是通过将这个间隔划分为等长的份来获得的。在确定可能的窗口大小之后,我们然后为活动Am计算最可能的窗口大小

8

我们还确定了与传感器si相关联的活动Am的概率(P(Am / si))。因此,给定所考虑事件的传感器标识符si,我们可以确定与之关联的最可能活动A*为

9

因此,对于传感器事件si,可以根据以下因式分解将两个方程式组合起来,确定最佳窗口大小

10

2.6  时间窗

我们还针对时间窗口方法评估了我们提出的方法,而时间窗口方法通常是在可穿戴传感器(例如加速度计)的文献中找到的。我们为每个传感器事件定义了时间窗口。因此,对于传感器事件si,时间窗口由所有传感器事件组成,这些事件均落在从si时间戳开始的固定持续时间的时间间隔内。然后使用与传感器窗口相同的过程,将特定时间窗口的传感器事件进行汇总,以形成特征向量。使用与时间窗口的最后一个传感器事件关联的活动来标记时间窗口。

2.7  处理“其他”类

当前大多数AR方法都忽略了与任何已知活动类别都不对应的传感器事件。当前的AR方法在评估算法的性能时往往会忽略这些其他活动类的存在。但是,在这项工作中,我们还将这些“其他活动”类中的传感器事件也包括在内,以确定最现实的活动识别性能。

有两种方法可以处理“其他”类事件。第一种方法依赖于从仅对属于已知类别的事件进行训练的模型获得的分类概率。此概率的阈值确定事件是否属于另一类。尽管这是一种简单的方法,但是由于没有学习确定阈值的值,因此很难设置阈值。在第二种方法中,通过对分类器进行训练,使其不属于任何已知类的事件,从而为其他类事件学习一个显式模型。

显式建模其他类事件使活动识别系统更接近流处理,因此是重要的一步。表1显示,每个智能公寓中几乎有一半的传感器事件属于另一类,进一步激发了学习此类模型的需求,这是本文采用的方法。

三、实验

3.1 实验配置

我们在从三个智能公寓测试台收集的传感器事件数据集上测试了本文中描述的思想,我们将其表示为B1,B2和B3。图6显示了三个公寓的平面图和传感器布局。每个智能公寓都容纳一个老年人。在我们收集公寓数据的六个月中,居民居住在这些公寓中并执行其日常工作。

在本文中,我们使用支持向量机(SVM)作为学习活动模型的分类器的选择。评价指标选择准确值和F值。

3.2 试验结果

1314

我们想研究哪些活动从建议的修改中受益。为此,我们为每个活动绘制了单独的F值,如图8所示。我们观察到,“ Leave_Home”和“ Enter_Home”活动通过采用SWMI + PWPA方法而受益最大。“ Enter_Home”的重大提升是可以理解的,因为它具有明确的过去背景。使用SWMI + PWPA方法可以观察到这些活动的最佳性能。

从图中也可以观察到三个测试台上每种活动的不同方法的性能差异。有些活动(例如“睡眠”,“个人卫生”和“洗澡”)相对于其他活动被认为相对更好。活动。 “ Leave_Home”是要在所有三个测试平台上进行识别的最困难的活动。这可能是由于这些活动是在明确定义的地点或一天中的稳定时间内进行的。例如,“沐浴”活动发生在早晨在测试床的“浴缸”区域。每个测试床都有一个专门的传感器,可以监控“浴缸”区域的运动,因此可以作为活动的可靠标记。

对于“其他”活动,F值的变化不大,在所有三个测试台上使用不同的方法。此外,该活动的F值平均值约为0.8,这相对较高,表明当前技术具有处理此类数据的能力。我们使用导致预定义活动(SWMI + PWPA)最佳分类精度的方法来计算每个测试平台的混淆矩阵,以研究大型“其他”活动类别的影响。这些以下图所示的归一化混淆矩阵的形式进行了总结。大量深色阴影块占据了矩阵的其余部分,这表明,所提出的技术在已知活动集之间的混淆度较低。但是,三个混淆矩阵中的每一个的最后一列都比矩阵的其余部分轻得多,这表明与已知活动相对应的许多传感器窗口被误分类为“其他”活动。

1112

所提出的方法平均需要4天的时间来学习每种技术的不同活动模型。尽管此值很高,但由于训练通常是离线进行的,因此它对实时识别没有影响。所有这些方法都能够以每秒超过100个样本的速率对测试样本进行分类,这意味着可以在线识别。

四、总结,局限性和今后的工作

为了为现实应用提供可靠的活动相关信息,研究人员需要设计技术以从传感器数据中实时识别活动。在本文中,我们提出并评估了一种基于滑动窗口的方法,以在线或流式方式执行活动识别。在记录新传感器事件时以及在记录新传感器事件时识别活动。考虑到以下事实:可以通过传感器事件的不同窗口长度来最好地描述不同的活动,我们将时间衰减和基于互事件的传感器事件加权基于一个窗口。先前活动和先前窗口活动的形式的附加上下文信息也将附加到描述窗口的功能上。虽然这些修改中的每一个都显示出相对于基线方法的改进,但是我们观察到,将基于互信息的传感器事件加权结合在一起,并将过去的上下文信息添加到功能中,可以实现流活动识别的最佳性能。

提议的方法的局限性在于它无法有效地模拟“其他”活动类别。当前方法将与任何已知活动都不对应的所有传感器窗口关联为单个“其他”活动,从而导致数据偏斜。结果表明,与已知活动相对应的窗口与“其他”活动之间存在高度的混淆,通过探索为“其他”活动类别建模的其他方式来减少这种困惑是我们计划追求的未来方向。在当前的评估方法中,训练和测试传感器窗口是从同一智能公寓的样本中绘制的。作为未来工作的一部分,我们还将评估针对从不同智能公寓中采样的训练和测试数据提出的方法的有效性。

 

 

anyShare分享到:
This entry was posted in 例会. Bookmark the permalink.

发表评论