芯片表面字符识别项目(Scrum第三组)

项目简介:芯片表面的字符通常会有不同程度的磨损和划痕,本项目通过神经网络的训练来完成芯片字符的自动识别。

人员安排

姓名 职务
卞景帅 产品负责人、开发人员
程露 Scrum Master、开发人员
饶永明 开发人员

 

产品待办列表

问题 优先级(1-3)
数据收集 1
图像分割 2
人工分类 3
网络训练 3

 

项目安排

本项目按照Scrum敏捷开发流程进行开发,分为以下4个sprint进行开发。

scrum

sprint表

Sprint1:数据收集【3月17日~3月20日】

待办列表:去工厂用安装摄像头的机器拍摄流水线上芯片的俯视图,获取神经网络的训练数据和测试数据。

时间安排:3月17日~3月19日:由于要获取大量的训练数据,每天流水线上的芯片数量有限,故安排三天的时间进行收集。

评审会议:3月19日:待办列表哪些已经完成和没有完成。

回顾会议:3月20日:Scrum团队检视自身并创建下一个Sprint改进计划的机会,明确接下来的Sprint中需要实施的改进。

 

Sprint2:图像分割【3月21日~3月28日】

待办列表:设计一个图像分割算法,将芯片上的字符依次提取出来。

时间安排:3月21日~3月27日:为了获取芯片图像上的字符信息,需要设计一个分割算法将图像中的每个字符提取出来,考虑到分割的准确性,故为该sprint分配的时间长一些,为期一周。

评审会议:3月27日:待办列表哪些已经完成和没有完成。

回顾会议:3月28日:Scrum团队检视自身并创建下一个Sprint改进计划的机会,明确接下来的Sprint中需要实施的改进。

 

Sprint3人工分类【3月29日~4月1日】

待办列表:1.将客户不可接受的不完整字符剔除掉,获取可训练数据;

2.将筛选过的字符按照字符类别进行分类,分别放入不同的文件夹。

时间安排:3月29日~3月30日:筛选数据

3月31日~4月1日:数据分类

评审会议:4月1日:待办列表哪些已经完成和没有完成。

回顾会议:4月1日:Scrum团队检视自身并创建下一个Sprint改进计划的机会,明确接下来的Sprint中需要实施的改进。

 

Sprint4:网络训练【4月2日~4月15日】

待办列表:1.训练一个CNN网络,通过检测图像获取芯片上的字符信息,识别率提高至98%;

2.对预留的未训练数据进行测试,检测字符识别率是否达要求;

3.若测试结果未达到98%的识别率,重新调整网络结构或参数,直至满足为止。

时间安排:4月2日~4月14日:考虑到CNN的复杂性和字符的识别率,在初次完成测试的时候后期可能还需要反复迭代调整,故安排时间最长,为期12天。

评审会议:4月14日:待办列表哪些已经完成和没有完成。

回顾会议:4月15日:Scrum团队检视自身并创建下一个Sprint改进计划的机会,明确接下来的Sprint中需要实施的改进。

 

每日站会:为了提高工作效率,每日晚上10:00花10分钟时间开会讨论。主要是:

  • 为达到Sprint目标今天我们做了些什么?
  • 为达到Sprint目标明天我们准备做什么?
  • Sprint的目标达成的过程中会遇到什么阻碍?
anyShare分享到:
This entry was posted in 新闻动态. Bookmark the permalink.

12 Responses to 芯片表面字符识别项目(Scrum第三组)

  1. 卞, 景帅 says:

    Sprint4评审会议及回顾会议记录
    Sprint4即网络训练,安排在4月2日至4月15日。
    于4月14日开展了评审会议(参会者:scrum团队、客户),会议时长30分钟,对前期工作做的总结如下:
    1、该sprint的待办列表主要包括:(1)用python语言实现160万张tif格式的图片转换成tensorflow能接受的tensor输入格式的功能。(2)使用开源框架tflearn和tensorflow完成数据的预测和训练,设计一个网络框架,根据先验知识,初始化一个较合理的参数,用该网络对160万图片进行预训练并对参数进行调优。目前已全部完成工作,并且客户也比较满意。
    2、该sprint阶段遇到的问题有:(1)在相似字符识别的过程中有存在一定的误识别率,比如字符8和B,经过优化降低了几率。(2)数据量大,训练周期长,程序中途中断的话会导致重新训练,后经改进,每训练一段时间,存储中间结果,即便后来中断,也可回溯。
    于4月15日开展了回顾会议,会议时长15分钟,主要检视我们团队自身在sprint4阶段的问题。我们该sprint4中列出了两大产品代办列表,没有对此做出更细的任务划分,导致在后期完成的时候任务不是很明确,效率较低。

  2. 卞, 景帅 says:

    4月14日晚上7点站会小结:
    程露:帮助scrum团队成员了解产品代办列表的“完成”的含义。目前,sprint4的工作量已全部完成。
    卞景帅:负责跟客户汇报项目进度,展示项目的迭代增量,客户对此表示非常满意。
    饶永明:完成网络训练的工作,芯片表面字符识别精度达到客户要求。

  3. 卞, 景帅 says:

    4月11日晚上10点站会小结:
    程露:负责帮助scrum团队成员清晰产品代办列表,了解“完成”定义,并清楚时间安排,督促完成计划安排。
    饶永明:使用开源框架tflearn和tensorflow完成数据的预测和训练,设计一个网络框架,根据先验知识,初始化一个较合理的参数,用该网络对160万图片进行预训练并对参数进行调优。
    卞景帅:用python语言实现160万张tif格式的图片转换成tensorflow能接受的tensor输入格式的功能。

  4. 卞, 景帅 says:

    4月7日晚上10点站会小结:
    程露:
    督促sprint4的顺利进行,协助scrum团队成员理解项目目标,清晰产品待办列表。

    饶永明和卞景帅:
    有条不紊地进行数据训练,数据测试、以及代码优化,争取在规定时间内圆满完成任务。

  5. 卞, 景帅 says:

    Sprint3评审会议及回顾会议记录
    Sprint3即人工分类,安排在3月29日至4月1日。
    于4月1日开展了评审会议(参会者:scrum团队、客户),会议时长30分钟,对前期工作做的总结如下:
    1、该sprint的待办列表主要包括:(1)将客户不可接受的不完整字符剔除掉,获取可训练数据;(2)将筛选过的字符按照字符类别进行分类。目前已全部完成工作,并且客户也比较满意。
    2、该sprint阶段的工作内容比较简单,但是工作量很大,每天要处理很多数据。最大的问题就是筛选数据一开始没有统一的标准,团队成员在筛选时常出现歧义,后面重新制定准则后大大提高了我们的工作效率。

    于4月1日开展了回顾会议,会议时长15分钟,主要检视我们团队自身在sprint3阶段的问题。我们最主要的问题就是没有和客户进行有效沟通,往往客户说明的需求并不完整,而我们团队也缺少对客户进行有效的引导,这直接导致后期在筛选数据时候产生歧义。后来,我们重新与客户沟通,落实到具体的条条框框,制定统一的筛选标准,以免成员理解偏差造成数据的差异,影响网络训练。

  6. 卞, 景帅 says:

    4月1日晚上10点站会小结:
    程露:
    目前,我们已完成了sprint3的工作内容,待办列表主要包括筛选符合条件的字符和对筛选后的字符按类别分类。工作内容比较简单,遇到的最主要问题就是在筛选数据的时候团队成员会有歧义,有时候我认为人眼可识别的字符,团队其他成员认为不符合要求,这时候我们就需要制定统一的规则,以免后期数据会有较大的差别,而我们的主要原则就是客户至上,一切以客户的需要为主,让客户为筛选数据制定标准。
    卞景帅:
    前期我们的主要工作是筛选字符并分类,工作简单但工作量却很大,其中还有一主要问题就是芯片字符表面的磨损程度不一,划痕深浅不同,故在筛选时团队成员会有歧义,这时我们会以客户的要求为标准,统一按照标准筛选数据。
    饶永明:
    Sprint3阶段的工作内容简单却又繁琐,今天和昨天我们主要是为数据分类,为下一个sprint网络训练识别不同字符做准备。现在已基本完成工作内容,数据量也满足训练和测试。

  7. 卞, 景帅 says:

    Sprint2评审会议及回顾会议记录
    Sprint2即图像分割,安排在3月21日至3月28日。
    于3月27日开展了评审会议(参会者:scrum团队、客户),会议时长30分钟,对前期工作做的总结如下:
    1、该sprint的待办列表主要就是设计一个行之有效的图像分割算法提取芯片表面上的字符,并用matlab工具编程实现。目前,我们已顺利完成了这一目标,并且达到客户要求的分割精度,对我们工作表示满意。
    2、在sprint2阶段,我们团队仅用了一半的时间就完成了该阶段80%的工作量,这一度让我们认为可以提前结束sprint2然后紧接着开始下一个sprint,然而在后期阶段,我们几乎花了一小半的时间优化算法,使分割更准确,尽可能减少由于分割的偏差对后期网络训练的影响。这也说明了在sprint计划会议上我们的时间安排是合理的。
    3、跟客户简要说明了下一个sprint的工作计划,列了产品待办列表,使客户和团队的目标都更加清晰,提高我们的工作效率,也增加产品的透明性。

    于3月28日开展了回顾会议,会议时长15分钟,主要回顾了一下sprint2的工作内容,检视自身在该sprint中遇到的主要问题,并制定改进scrum团队工作方式的计划。因为团队有成员办公地点不在一起,这就不可避免造成我们多数时候的沟通不及时,于是我们约定每天中午十二点半定点使用QQ软件交流一次,并且在每晚十点的站会上提自己的问题,这样至少可以保证每天遇到的问题不会留到第二天解决。

  8. 卞, 景帅 says:

    3月28日晚上10点站会小结:
    程露:
    目前,项目的sprint2阶段已经到了尾声,完成了图像分割的任务。之前计划若提前结束sprint2,考虑在回顾会议阶段提前开始sprint3,努力向向一个目标冲刺,但最后也是在sprint2结束的节点完成了待办列表的任务,并没能提前完成计划,这也证明了之前我们在sprint计划会议上的时间安排也是合理的,我们预留了算法优化部分的时间,让分割结果更为准确。通过这件事,我明白了一个道理,即我们不能为了冲刺而降低目标的质量,一切都是为了产品服务的。
    卞景帅:
    昨天和客户一起开了sprint2评审会议,汇报了我们项目的进展,客户对我们目前完成的小目标感到非常满意,这也令我们团队感到很欣慰。今天下午我们scrum团队也进行了sprint2的回顾会议,我发现团队对于时间安排比较合理,这点需要继续保持,但是对于团队交流还是不够及时,希望下一个sprint能够改进。
    饶永明:
    作为项目的主要开发人员,前期主要负责图像分割算法的设计与实现部分,现这一目标已顺利达成,且分割的结果符合预期,客户也比较满意。在实现过程中,算法的优化部分占据了几乎一半的时间,这也让我明白了一个好的开发人员应该投入大量的精力完善目标,而不是仅仅满足于功能的实现。

  9. 卞, 景帅 says:

    3月25日晚上10点站会小结:
    程露:
    目前,项目进行到sprint2的中期阶段,我们的目标完成了80%左右,还有细节部分有待优化,顺利的话我们会超前完成sprint2的工作计划,提前结束sprint2。如果可以提前完成,考虑在sprint2的回顾会议上修改我们sprint3的开始节点,提前开始sprint3的工作,为下一个冲刺做准备。如果后期优化的部分难攻克,继续按原计划执行,加班加点也要在sprint2结束前完成工作。
    卞景帅:
    Sprint2前期阶段,负责图像分割算法的设计框架,并且作为产品负责人,在sprint2前期阶段进行得如此顺利的情况下,决定在站会结束后立即为sprint2中剩余工作重新计划,以便更好完成工作。
    饶永明:
    作为项目的开发人员,在sprint2前期阶段,负责图像分割算法的详细设计与具体实现,在项目计划的初期,我们没有想到在设计算法的时候会如此顺利,导致时间安排上有些富余。Sprint2后期部分主要完成算法的优化部分,使芯片在分割的时候更精确,尽可能减少磨损和划痕部分以及拍摄时的方位角对分割的影响。期间可能会遇到瓶颈,但是无论如何也要在sprint2结束时完成工作。

  10. 卞, 景帅 says:

    3月21日晚上10点站会小结:
    程露:
    昨天已顺利完成了sprint1阶段的工作,协助scrum团队了解项目进度,今天开始sprint2即图像分割的工作,确保每位成员了解自己负责的工作,清晰产品待办列表。
    卞景帅:
    我们昨天已经完成了sprint1,并且跟客户汇报了进展,今天sprint2也开始了,图像分割是网络训练的前期工作,我们需要设计合理的分割算法以确保数据都合格有效。
    饶永明:
    作为项目的开发人员,清晰每个sprint的计划,明确产品待办列表,负责图像分割算法的设计与实现部分,为后续网络训练做数据处理。

  11. 卞, 景帅 says:

    3月17日晚上10点站会小结:
    程露:
    对本项目的sprint做了初步的计划,协助scrum团队成员理解项目目标,清晰产品待办列表,并且负责sprint1数据的收集工作。
    卞景帅:
    对本项目的sprint计划做了适当调整,负责和客户交流,确保开发团队对产品待办列表都有足够深的理解。
    饶永明:
    对本项目的sprint计划做了细微调整,了解产品待办列表。

  12. 卞, 景帅 says:

    Sprint1评审会议及回顾会议记录
    本scrum项目一共分为四个sprint,数据收集、图像分割、人工分类和网络训练,其中sprint1即数据收集,安排在3月17日至3月20日。
    于3月19日开展了评审会议(参会者:scrum团队、客户),会议时长30分钟,对前期工作做的总结如下:
    1、该sprint的待办列表主要包括训练数据和测试数据的收集,为后续工作提供数据支持。本次收集的数据量基本满足后期网络训练和测试的需求。
    2、与客户讨论了目前数据的收集的情况以及接下来的项目计划安排。
    3. 该sprint中的时间主要花费在数据的传输的过程中,目前选取的百度云数据传输方式花费时间过长。

    于3月20日开展了回顾会议,会议时长15分钟,主要回顾sprint1的工作内容并探讨sprint2的改进情况,提高我们的工作效率。

发表评论