基于语音控制和视觉图像识别的分拣搬运机器人
2019年06月04日 20:35         所属学院: []          点击:


附件5

湖南省大学生研究性学习和创新性实验计划

项  目  申  报  

 

项目名称:

  • 如果您无法在线浏览此 PDF 文件,则可以

  • 下载免费小巧的 福昕(Foxit) PDF 阅读器,安装后即可在线浏览  或

  • 下载免费的 Adobe Reader PDF 阅读器,安装后即可在线浏览  或

  • 下载此 PDF 文件

学校名称

 新利luck在线·(中国)有限公司官网

学生姓名

  

      

 

   

邹智强

201457050125

电子信息工程

  

2014

 郭扬铮

201457050106

电子信息工程

  

2014

 屠君超

201457050120

电子信息工程

  

2014

 

 

 

 

 

 

 

 

 

 

指导教师

马钧

职称

讲师

项目所属

一级学科

控制科学与工程

项目科类(理科/文科)

   理科

学生曾经参与科研的情况

项目负责人和课题组成员均为电子信息工程及自动化等相关专业本科生,已进入学校创新实验室学习一年以上,对于单片机编程已经相当熟悉,且有一定的ARM嵌入式开发基础。且熟练掌握C/C++Linux环境编程、数据结构、且具有一定的算法设计能力以及PCB设计能力、承担过一些单片机应用系统的开发项目、开关电源设计以及机器人竞赛。团队成员曾在各级科技竞赛中多次获奖,获奖情况如下:

项目负责人邹智强:

2016年中国国教育机器人大赛全国一等奖

2016年全国大学生电子设计竞赛模拟电子系统专题邀请赛全国二等奖

2016年湖南省大学生电子设计竞赛省二等奖

2016年新利luck在线·(中国)有限公司官网科技立项校一等奖

2016年新利luck在线·(中国)有限公司官网“电苑杯”电子设计竞赛校二等奖

2016年新利luck在线·(中国)有限公司官网“互联网+”创业大赛校二等奖

2016年新利luck在线·(中国)有限公司官网“创青春”创业大赛校二等奖     

项目成员王料丰:

2016年湖南省大学生电子设计竞赛省一等奖

2016年新利luck在线·(中国)有限公司官网“物电杯”电子设计大赛校二等奖

项目成员郭扬铮:

2016年湖南省大学生电子设计竞赛省一等奖

2016年新利luck在线·(中国)有限公司官网“电苑杯”电子设计大赛校二等奖

2016年新利luck在线·(中国)有限公司官网“创青春”创业大赛校二等奖

2016年新利luck在线·(中国)有限公司官网“互联网+”创业大赛校二等奖

项目成员屠君超:

   2016年新利luck在线·(中国)有限公司官网“电苑杯”电子设计大赛校二等奖

   2016年新利luck在线·(中国)有限公司官网科技立项校一等奖

   2016年新利luck在线·(中国)有限公司官网“物电杯”电子设计大赛校三等奖

 

 

指导教师承担科研课题情况

1. 主持2013年国网湖南省电力公司科学研究院项目,项目名称:“配电自动化系统一致性测试技术的研究”, 20134~20149月(结题);

2. 主持2012年湖南省科学技术厅科技计划项目,项目名称:“智能配电网通信安全装置的研制”,项目编号:2012GK3053(结题);

3. 主持2010年湖南省高校重点实验室项目“智能电网公共网络通信数据安全防护研究”(结题)。

4. 主持2014年省教育厅项目“基于IEC61968标准和营配信息融合的配电网公共信息模型建模方法研究”,项目编号:14C0023(在研)。

 

项目研究和实验的目的、内容和要解决的主要问题

一、项目研究的目的

随着科技的发展,机器人的应用将越来越广泛。分拣搬运机器人是一种能够对物体进行分类整理以及搬运的机器人,现在一般的分拣搬运机器人主要依靠寻迹功能,仅能简单识别物体颜色,并依靠单一的动作设置来完成任务。在面对复杂环境,或者环境特征变化是,这种机器人的工作性能就会受到影响,甚至不能正常使用。为了进一步提高分拣搬运机器人的智能化和实用化水平,我们开展本项目的研究,其主要目的是:

   1)解决当前主流分拣搬运机器人环境适应能力差、智能化水平不高的问题,让机器人能够应对比较复杂的环境,能够识别比较复杂的物体。

   2)提高分拣搬运机器人的语音识别能力,使其能够接收语音指令并实施搬运任务。

 

二、研究内容

   本项目主要致力于研究机器人经过语音教导与记忆,通过视觉导航与图像识别来完成一些物块的分类与搬运、以及整理货物等功能。本项目主要研究内容如下:

   1)研究机器人语音识别模块,通过此模块,机器人能对用户说的话进行识别分析,用户能通过语音对机器人下达搬运命令。

2)研究机器人通过摄像头采取图像识别以及超声波测距等手段,来进行简单地形的导航分析和物块的识别与分类功能。

3)研究机器人的记忆功能,使其在用户不使用语音的情况下自动执行用户想要执行的任务,也就是定时执行功能。

4)研究提高分拣机器人搬运物块到指定地点的可靠性问题。

5)研究机器人通过无线网络接入互联网,进行远程监控,以及程序在线升级等。

 

三、要解决的主要问题

   1)解决当前主流分拣搬运机器人环境适应能力差、智能化水平不高的问题,让机器人能够应对比较复杂的环境,能够识别比较复杂的物体。

   2)提高分拣搬运机器人的语音识别能力,使其能够接收语音指令并实施搬运任务。

3)重点解决机器人数字图像处理的问题,这是视觉识别的关键。为了解决这一问题,需要掌握OPENCV的视觉库来进行图像处理,并需要掌握支持OPENCV的嵌入式Linux操作系统。

 

国内外研究现状和发展动态

国内研究状况:

近十年来,国内机器视觉技术制造商发展迅猛,涌现出很多优秀的公司。其中北京大恒图像视觉有限公司研制的系统是自主研发的基于视觉技术的 PCB外观检查系统。检测精度高、速度快,系统实现对 PCB 无遗漏、全幅面检测。机器视觉在机械手上的应用也取得了一定的成果。中科院自动化研究所复杂系统与智能科学实验室开发的 CASIA-I 型机器人是集多种传感器,视觉,语音识别与会话功能与一体的智能移动机器人。博创科技自主研发的小型排爆机器人 RAPTOR-EOD,该排爆机器人可以帮助排爆人员可以在远距离以无缆操作方式对机器人进行精确操作。

国外研究状况:

目前,机器视觉技术已经从最初的实验室阶段逐渐走向成熟,并且在工业生产线上已经有实际应用。德国、日本、美国和韩国处在智能工业机器人领域应用研究的前沿。日本从最初的模仿到现在的独创,找到了自己的技术创新之路。德国西门子公司也紧跟着时代的步伐,将机器视觉渗透到各个领域,应用到汽车发动机装配,生产线工件分拣等领域。美国更是机器人技术的创新发源地,其机器视觉广泛应用在工业和军事上,机械手经销商,包括 Fanuc 公司,Motman 公司和 Staubli 公司都推出了拣选系统。

今后机器人将逐渐向智能化发展,其语音识别和视觉识别在机器人上的应用实例也越来越多,但是目前仍然存在着很多难以攻克的技术难点,多变的环境、复杂的地形;技术的保密性使得科研成果不能共享,从而造成相关基础技术重新开发等问题。

本项目学生有关的研究积累和已取得的成绩

项目组成员已经掌握了电子与自动化技术的相关基础理论知识以及专业知识,有较强的电路设计能力,曾经参加过各种校级省级和国家级别的电子设计大赛并取得了较好的成绩。

在机器人方面,项目组成员对于语音识别方案及其实现、机器人视觉识别环境的搭建、以及简单的二维形状检测都已完成。对于语音识别模块,我们已经对于简单的8字以内的中文语音识别做过前期实验与测试,识别度较高。而对于电机驱动,电源模块,摄像头模块等,我们都已掌握并做过相关的创新实验或者设计。

项目负责人参加了全国教育机器人大赛并获得了国家一等奖证书,其参赛题目就是一个分拣机器人,机器人可以在规定的轨迹地图上行走,并且可以识别地图上分散的物块颜色,并将其分类搬运到指定位置,所以对机器人的运作方式也十分了解。

  

项目的创新点和特色

1、项目采用语音控制和语音训导技术,机器人通过与用户的语音沟通能完成用户所给定的搬运任务,第一次执行搬运任务会需要人工语音教导哪种物块该放在哪个区域,之后机器人将不需要第二次人工教导,将会自动将此类物块放到指定区域。

2、项目采用视觉识别传感技术,通过摄像头将图像信息传送给处理器,经过计算分析实现物块的识别、分类以及路线导航。

3、能通过WIFI模块接入互联网,能对机器人实行远程监控和在线升级更新。

 

项目的技术路线及预期成果

一、技术路线

机器人系统整体设计方案如图1所示,整个系统可以分为以下主要部分:电源模块、控制模块、摄像头模块、语音模块、电机驱动模块。其中摄像头是机器人的眼睛,可以对物体进行识别,包括形状检测和颜色检测;语音识别模块是机器人的耳朵,可以听取用户所要求的任务信息;控制模块是机器人的大脑,对于语音识别模块采集的语音信号进行分析然后确立搬运方案,对摄像头采集的图像信号进行查找目标、分析确定行程路线、分析物块形状、分析物块颜色,从而确定搬运目的地;电机驱动模块是机器人的手和脚,手是机器人的机械臂,脚是机器人的轮子,机械臂可以更好的抓取并搬运物块,轮子能使机器人运行到工作区域的各个位置;而电源模块是机器人的心脏,用于给所有模块供电,保证其正常的运行。

1机器人系统整体设计方案

  1)电源模块

   模块采用两节带保护板的18650并联电池供电,经过一个DC/DC升压模块,将电源电压稳定到5V供电,再经过线性稳压器AMS1117-3.3将其降压到3.3V给芯片供电。一般锂电池放电到2.8V就会被保护板自动断电,如果直接采用两节电池串联通过7805供电的话,那么当电压降到5.6V时,7805会因为输入输出电压差值不够,而使输出电压下降到低于5V,这时对于电机的供电驱动就会和5V时候不一致,会导致原来设置好的转动角度以及其他的新能参数有偏差,从而导致系统不正常工作,而采用升压的方案就不会因为锂电池放电导致低电压,从而保证系统正常工作。

   2)主控单元模块

   该模块作为机器人的大脑,对摄像头和麦克风传入的信号进行分析处理,再通过GPIO控制电机使机器人动起来。主要由处理器、SRAMflash/EEPROMGPIOWIFI等部分组成。本项目将采用ARM Cortex A系列的处理器作为核心,ARM公司的Cortex-A系列处理器适用于具有高计算要求、运行丰富操作系统以及提供交互媒体和图形体验的应用领域。鉴于本项目需要进行数字图像处理和嵌入式开发,对于数字计算的能力要求较高,我们将采用Cortex A8以上级别的芯片。

   3)语音模块

该模块作为机器人的耳朵,用于听取命令,使机器人按照命令执行任务。主要由麦克风、放大器、专业芯片组成。为了简化机器人的编程难度,我们将选用一个语音识别专用芯片LD3320LD3320芯片由ICRoute公司设计生产。该芯片集成了语音识别处理器和一些外部电路,包括ADDA转换器、麦克风接口、声音输出接口等。本芯片在设计上注重节能与高效,不需要外接任何的辅助芯片如FlashRAM等,直接集成在现有的产品中即可以实现语音识别/声控/人机对话功能。并且,识别的关键词语列表是可以任意动态编辑的。

主要特征有: 

l  1、通过ICRoute公司特有的快速而稳定的优化算法,完成非特定人语音识别。不需要用户事先训练和录音,识别准确率95% l 

2、不需要外接任何辅助的Flash芯片,RAM芯片和AD芯片,就可以完成语音识别功能。真正提供了单芯片语音识别解决方案。 l 

3、每次识别最多可以设置50项候选识别句,每个识别句可以是单字,词组或短句,长度为不超过10个汉字或者79个字节的拼音串。另一方面,识别句内容可以动态编辑修改因此可由一个系统支持多种场景。 l 

4、芯片内部已经准备了16A/D转换器、16D/A转换器和功放电路,

麦克风、立体声耳机和单声道喇叭可以很方便地和芯片管脚连接。立体声耳机接口的输出功率为20mW,而喇叭接口的输出功率为550mW,能产生清晰响亮的声音。 l  

5、支持并行和串行接口,串行方式可以简化与其他模块的连接。 l  

6、可设置为休眠状态,而且可以方便地激活。 

l  7、工作供电为3.3V,如果用于便携式系统,使用3AA电池就可以满足

   4)摄像头

摄像头将采用OV7670摄像头,体积小,工作电压低,提供单片VGA摄像头影像处理器的所有功能。通过SCCB总线控制,可以输入整帧、子采样、取窗口等方式的各种分辨率8位影像数据。该产品VGA图像最高达到30/秒。用户可以完全控制图像质量、数据格式和传输方式。所有图像处理功能过程包括伽玛曲线、白平衡、饱和度、色度等都可以通过SCCB接口编程。OmmiVision图像传感器应用独有的传感器技术,通过减少或消除光学或电子缺陷如固定图案噪声、托尾、浮散等,提高图像质量,得到清晰的稳定的彩色图像。

    对于机器人数字图像处理的问题,由于我们并没有系统的学习过数字图像处理,而数字图像处理本身就是一个大难点,导致视觉识别是我们需要重点突破的地方。为了解决这一问题,我们将采用OPENCV的视觉库来进行图像处理。OpenCV全称是:Open Source Computer Vision LibraryOpenCV是一个基于BSD许可(开源)发行的跨平台计算机视觉库,可以运行在LinuxWindowsMac OS操作系统上。它轻量级而且高效由一系列 C 函数和少量 C++ 构成,同时提供了PythonRubyMATLAB等语言的接口,实现了图像处理和计算机视觉方面的很多通用算法。由于OPENCV只支持于一些操作系统的环境下,所以在嵌入式系统这一方面,我们也需要全面的学习。优先选择嵌入式Linux

   5)电机驱动模块

   电机模块主要分为轮子电机和机械臂的电机,轮子控制机器人位置的移动,机械臂控制机器人更好的抓取物块。电机主要采用伺服电机,伺服电机具有很好的精准度,非常适合用于机器人上。通过给予伺服电机一系列脉冲信号,电机即可根据脉冲数旋转固定的角度。而对于电机供电方面,需要单独供电与主控制电路隔离开来,这样可以有效保护主电路稳定性。

   6)软件设计

软件设计基于Linux平台开发以及模块单片机开发,其语音模块上就有一个单片机,用于语音解码,将语音信号翻译成搬运任务信号。主控单元搭载Linux操作系统,用于接受搬运任务信号、接受摄像头的图像信号、输出电机控制信号、进行图像处理和整个机器人的信号交互与处理。

程序开始处于待机状态,等待用户的语音命令。这时主控单元等待语音模块的信号响应,语音模块检测到语音命令后会解析命令并向主控单元发送中断信号以及经处理过得搬运任务信号,主控单元响应中断信号并接受任务信息,同时将信息存入Flash

接下来采用视觉导航和超声波模块来搜索物块。找到物块后,对物块进行图像分析识别出物体的形状和颜色进行归类。以确定要送到的目标地,并进行搬运。最后找到目标地并将物块放入目标地。程序判断是否执行完所有操作,如果没有完成,继续执行搬运任务。

机器人搬运程序流程图如图2所示

 

                                  2机器人搬运程序流程图

 

    

 

二、预期成果

1项目总结报告一份

2制作分拣搬运机器人实物一件。

3. 论文一篇或申请专利一项。

 

  年度目标和工作内容(分年度写)

进度安排:

1201611月至20172月,完成资料的收集以及方案的确立

220173月至8月,进行图像处理、嵌入式系统等知识的深入学习以及实验应用。

320179月至10月,完成机器人硬件电路的设计与实物搭建。

4201711月至12月,完成程序算法等软件设计。

520181月至3月,完成整个机器人的调试与测试。

620184月至6月,编制研究工作总结报告,发表论文或专利,准备结题。

指导教师意见

人工智能技术已经渗透进我们生活的方方面面,正日益成为新一轮产业革命的引擎。选择分拣搬运机器人作为创新项目正是适应这一产业发展需求,其中的语音控制和视觉图像也是应用广泛的实用技术,体现了本项目以需求为导向的用意。项目所选处理器ARM Cortex A的应用,以及在视觉图像识别所需C/C++编程上具有一定难度;把语言控制和图像识别两种技术融合进机器人的感知系统,也需要一定的综合应用能力。

 项目组成员均来自创新实验室,参加过机器人和各级电子设计竞赛并获奖,有能力在已学机器人技术基础上做好本项目的研究、设计和制作工作。

本项目具有很好的实用性,开展本创新研究有助于提高学生的实践能力和创新能力,同意申报该项目。

 

 

签字:  马钧       日期:2017.4.13