学习笔记(2014.11.24)-Bioinformatics第四章“Signal Processing Methods for Mass Spectrometry”脉络分析及深度学习实例初步理解

本周主要完成了<Bioinformatics>中第四章全部和第五章部分的翻译,从内容页数上,占总任务的比例为88/120。同时对前面第三章翻译的内容进行了修改。初步学习了文章<Deep Learning for Healthcare Decision Making with EMRs>部分内容。

<Bioinformatics>第四章主要面向生物系统领域,介绍了质谱分析法中的一些信号处理方法。质谱法即用电场和磁场将运动的离子按它们的质荷比分离后进行检测的方法。本章脉络如下:

  • 对细胞分子应用质谱法首先要解决离子化问题,本章介绍了四种电离生物分子的技术,详细介绍了电喷雾电离和软激光电离技术的发展历程。
  • 获得生物离子后还需要对其进行预处理,不同生物离子的预处理过程不同,例如电喷射技术不需任何预处理,而矩阵辅助的激光解析电离需将样品制备溶液与基质溶液混合,通过蒸发结晶将样本与基质分离。
  • 预处理后的离子通过一种渡越时间管TOF进行分离。详细论述了分离过程的物理学原理。
  • 进行离子检测,通过使用质量已知的混合物进行校准,确定离子荷质比。
  • 对实验获得的数据进行校正,并介绍了实验获取数据过程中可能出现的两类问题。

本章根据以上流程中可能遇到的各种问题提出相应的解决技术。重点介绍了信号重采样技术,通过信号重采样获得较小的易于管理的数据量,并对不同仪器测量得到的数据进行处理,以获得均一化的荷质比范围。通过上、下采样实例对此详细说明。

由于基质中的化学噪声或离子超负荷可引起基线变异,所以减去基线后的频谱更易分析。本章提出对质谱数据进行基线校正的方法,并列举三个适合使用基线校正的情况。使用四种低分辨率频谱,其分别取自两种不同低分辨率卵巢癌FDA-NCI数据集,来演示MS预处理过程。

由于校准过程和仪器设备可能存在误差,所以需要进行荷质比校正,本章列举了需要进行荷质比校正的三种情况,并通过程序实例演示。

很多系统原因会导致电离强度的变化,为弥补系统差异,可以规格化频谱的相对强度。

本章回顾一些用于去除信号噪声的平滑技术,如局部加权散点滤波平滑,并与传统滤波相比较,分析其优势。利用生物信息学工具箱演示了噪声平滑的实例。

以上是对第四章的脉络分析。

初步阅读了文章<Deep Learning for Healthcare Decision Making with EMRs>的部分内容,其主要介绍了一种可以仿真人类思维过程并融合特征学习与表示技术的统一深度学习模型。使用改进的卷积深度置信网来训练大规模的数据集。解决了传统的基于规则的模型无法建模人类复杂思维和过度依赖问题域特征表示的缺陷。使用两个数据集进行测试,一个是医院信息系统中高血压数据集,另一个是来自电子病历中关于中医诊断治疗处方的数据集。结果表明本文提出的模型效果远优于传统的浅显模型。为更好的理解文章,我回顾了多层神经网络和深度学习有关内容。

下周计划:1、翻译完成第五章;2、修改第四章内容;3、翻译之余,研究非监督特征学习、受限玻尔兹曼机和深度信念网络。

anyShare分享到:
This entry was posted in 学习笔记. Bookmark the permalink.

发表评论