【例会】研讨Discovering Biobrick quality assessment rules with machine learning

主持人:殷越

参会老师:杨矫云,安宁

参会学生:李雨龙,赵春阳,程坤,韩朋,贵芳,殷越

请假:郭思伊

本次例会主要研讨论文:Discovering Biobrick quality assessment rules with machine learning,指出论文中可能存在的问题

一、对标题和作者格式的修改意见:

1.严格按照杨老师所述格式进行格式规整:两个单位

二、对摘要等部分的修改意见:

1.背景过于简单缺乏对结论的简单论据,没有体现出可以将机器学习用于质量评估这一关键点

2.方法较为冗长,建议简化方法介绍

3.算法DNA敏感度与论文的核心之间的关系不明确

三、“第一章-介绍”的修改意见:

1.第一段提及的传统生化方法存在的问题,期望用机器学习的方法做质量评估,引出机器学习为什么可以用来实现质量评估。

第二段应该去写机器学习做质量评估应该怎么做,机器学习一般处理流程,从而衍生出的所属的这些相关方法

第三段到章节安排前,针对处理流程的每个环节,做综述。

2.”Sequence classification is crucial for computational biology with a variety of important application”缺乏与前文的衔接,仍然未凸显出机器学习可进行该类研究的可行性

3.”These methods produce strikingly different performance of sequence identification, yet few studies have compared them.”

4.“The design of appropriate sequence similarity measure is the key to address these problems. Generally, there are two categories of sequence similarity measures.”该句与前句不存在明显因果关系

5.如何定义shape measure

6.“The objective of this study is to design an automated and objective rule to evaluate quality of Biobrick by two measures”提出的rule并不明确,需要明确rule是什么,如何来做质量评估

四、“第二章-方法”的修改意见:

1.“Biobrick quality is modeled mathematically by the parameters of underlying probability distribution of guanine-cytosine (GC) content.”为什么要选择GC的含量做质量初筛

2.“5.1. Problem formulation”建议修改标题

3.One-vs-rest具体是什么

4.“5.2. Optimal classifier selection”这里基本都是别人的方法,建议放到相关工作里去写

5.”This section describes distance-based, feature-based and model-based classification methods.”这里要说自己的那一套rule具体是如何做的,如何实现的,也就是本文5.1中所写的内容

6.“four distance functions”只提到两种方法

7.5.2.4中的”Table3″实际应该写成“Table2”

五、“第三章-结果”的修改意见:

看杨老师那篇论文,最后引用那里的那篇,最后的result里也列出了一些显然有问题的biobrick,建议用这些数据扩充验证试验

anyShare分享到:
This entry was posted in 新闻动态. Bookmark the permalink.

发表评论