ICDM——Imputation of Missing Values in Time Series with Lagged Correlations

生物医学中的一些测试数据通常是与时间相关的,但是这些数据通常存在缺失。比如传感器功能损坏、移动网络中设备的间歇性失能、或者人为减少测试数据的频率等。数据的缺失通常会对分析结果造成严重影响,因此需要对这些数据进行补缺。

本文的方法是结合了K-NN方法与傅里叶变换。在K-NN方法中,在构建向量时,将时间间隔引入进来。而傅里叶变换方法的基本思路是,如果p~p+q时间段的数据缺失,则对1~p时间段内的数据进行傅里叶变化,以这1~p时间段内的傅里叶变换结果来作为1~p+q时间段内的傅里叶变化结果,然后预测出p~p+q时间段内的数据。

该方法的性能与缺失数据的时间段长短相关。通常缺失的时间越长,时间性能越差。

该方法应该可以扩展到一维生物序列数据缺失的补缺中。通过对生物序列进行傅里叶变换,然后利用变换后的结果反推出缺失部分的数据。

anyShare分享到:
This entry was posted in 新闻动态. Bookmark the permalink.

发表评论