您的位置:创新中国网 > 新闻

阿里工程师“造人记”

发布时间:2018年10月05日 12:55 来源:营口热线 编辑:樊华   阅读量:6285   
导读:文/王安忆9月22日,阿里巴巴在2018杭州·云栖大会发布AliOS2.0系统,定义下一代互联网汽车标准。无人区里没有顺风车。从0到1,AliOS研发团队走得艰辛,就像34岁的许晨光,作为一名AliOS无线开发专家,他揣着领导最初赞助的20...

文/王安忆

9月22日,阿里巴巴在2018杭州·云栖大会发布AliOS 2.0系统,定义下一代互联网汽车标准。

无人区里没有顺风车。从0到1,AliOS研发团队走得艰辛,就像34岁的许晨光,作为一名AliOS无线开发专家,他揣着领导最初赞助的2000多元,找开源代码、买3D打印机、DIY零部件、着手打造仿生机器人。有了这个机器人,多模态交互系统的训练工作才能事半功倍。

许晨光本以为,这项工作难度跟组装宜家橱柜差不多,哪晓得路上的坑一个接着一个,填到现在,他已经解锁了机电、雕塑、解剖等一堆新技能。在许晨光的努力下,一条机械手臂投入训练工作,这只是一个阶段性的成果,接下去,他还要为机器人添上另一条手臂、整个上半身躯干,以及头部和面部表情。

看得懂人的车

短短2年间,在路上奔跑的AliOS互联网汽车已有数十万台。而互联网汽车热销,多模态交互系统功不可没。

眼下,大部分车机系统基于手机安卓系统定制,可是安卓从底层、框架到应用的设计,都以近距离小屏触摸的手机场景为出发点,有点先天不足的意思。而AliOS从设计之初,在应用框架和交互体系方面就考虑到了汽车环境的需求。

触屏、语音、人脸、手势相结合的多模态交互系统,能够为司机带来颠覆性体验——比如通过人脸识别技术,汽车在认出司机身份后,会按照司机习惯调整好座椅、后视镜、空调风量以及歌单,就连油门灵敏度和换挡逻辑,也可以根据司机驾驶习惯设定。人车之间,不仅可以通过“语音+触摸”的方式交流,还可以通过“语音+手势”或“快捷手势”沟通。

重庆智博会上,AliOS曾展示了神奇的手势交互,司机轻轻挥一挥手,就能操控多媒体、地图等场景:做一个“love”手势,隔空收藏喜爱的音乐;一个食指左右滑动,就能升降音量;两个手指摆出“耶”,则代表拒接来电……

阿里工程师“造人记”

总之,在一辆互联网汽车里,摄像头是眼睛,麦克风是耳朵,将捕捉到的画面和声音,传递给AliOS这个大脑,司机不用低头查看车机屏幕就能控制汽车,这是一种沉浸式的智能新体验。

AliOS还在不断进化,今年6月下旬,许晨光所在的团队,主要任务就是支持包括手势识别、语音识别等多模态交互的升级测试,进一步将工具硬件化和产品化。

当老师的代价

AliOS能看懂人类的手势,是因为应用了视觉计算技术。和其他AI技术一样,视觉计算也要通过基于大量样本的训练,去不断优化模型和参数,这样AliOS才能更准确地识别不同角度的不同手势。

阿里工程师“造人记”

在训练的过程中,团队面临的最大问题在于,缺少手势图形数据,这些手势图形不但对定位精度有要求,还要经过人工打标签才行。

“深度学习的主要特点就是跟数据相关,实际生产中的问题,不是开发一个或者买来一个模型就能解决的。”许晨光想,使用人手的图像数据,需要花大量人力为手势图形打标签,“对于我们这样成本压力较大的部门来讲,这种方式不是最优解。”

最后,许晨光想到了可控机械手臂的方案,直接让硬件自动生成数据,来部分替代人工打标,相对现阶段其他方案,这个办法较为省时省力省成本。

可是,要买到一个现成的机械手臂并不容易,许晨光在网上搜寻,最基本的要求是,五个手指是否能分开运动、手腕和胳膊能不能运动。他找到一个机器手臂,却因为过于机械,定位精度达不到要求;另一个机械手臂动作很拟人,却因为重量太大,抬不起胳膊。

“机械手”、“仿生机器人”……许晨光用这些关键词搜索答案,却意外搜索到了法国的雕塑家盖尔·朗葛文,他只花了800美元就自制了一台真人大小的机器人,所需材料不过是一台3D打印机、一些电机以及电路板等。

朗葛文每完成机器人身体的一部分,就会在网上与人分享制作过程以及所需的材料等,重点是,朗葛文还说“这件事的难度和组装宜家橱柜差不多。”

廉价解决方案

盯着朗葛文提供的开源项目图纸,许晨光认为自己找到了一条捷径。7月中旬,他的办公桌上多了一台3D打印机,然后用随笔记录了整个项目的进程:

第一周:3D打印及加工手指、手掌、前臂等机械手部件,购置Arduino控制板、舵机、杜邦线、电钻、钻头、胶水、3mmPLA丝等部件。

第二周:打印完毕后,连接机械手手指、手掌、手腕、前臂零件装配、舵机安装及传动线,实现了可以通过arduino(开源电子原型平台)控制机械手进行单个手指的屈伸及手腕旋转运动。

阿里工程师“造人记”

第三周:终于实现了同时控制多个手指运动,并通过leap motion(体感控制器)实时追踪模仿人手手指运动(手指、手掌、手臂前臂部分基本制作完毕)。

第四周:制作上臂和肩膀部分,期间也在改进手指的机械结构,进一步提升机械的耐用性和控制的精确度。

网购一个完整设备,可能要花费几万元,许晨光的方案廉价地多——3D打印机花了1500元,前臂手指、手掌部分总共成本不到500元,上臂部分成本800元,另外准备集成一个主机,成本500元。

“我的领导马飞飞和黄宗明自掏腰包,提供了项目资金的支持。”许晨光把手放在连接电脑的leap motion上,比了“耶”的手势,左手边的白色机械手也“咔咔”伸出两根手指。

学解剖找问题

3D打印的过程异常缓慢,许晨光算过,一个5厘米厚的前臂零件,如果一切顺利,也要7-8个小时才能完成。

在组装前臂和肱二头肌的环节中,肘关节一个连接部位出了问题,只要许晨光想测试收起前臂的动作,总能听到“啪”一声脆响,连接部位8毫米厚的塑料零件被掰成了两半,“为什么手臂弯曲90度都不行?

阿里工程师“造人记”

许晨光低头摆弄着零件,在脑子盘算着:是不是零件在打印的时候参数没调对?3D打印有三四个小时等待时间,他也没有闲着,把没舍得扔掉的零件,拿强力胶粘起来再试,这一次前臂只弯曲到80度就断了。

“啪”“啪”“啪”,当零件第四次断裂时,许晨光抬起头,发现办公室里空空荡荡,就剩下他自己了,时间早就过了零点,他把第五片零件的参数设置好,第二天再赶来测试。

阿里工程师“造人记”

回家后,许晨光下载了《奈特人体解剖彩色图谱》,把这本书中第419页至第454页,关于“肘和前臂”以及“腕和手”的解剖图仔细研究了一遍。在一次又一次的试验中,许晨光最终找到问题所在,通过调节前臂中电机和零件的距离,便能在手臂弯曲时保全零件。“只能靠一次次试验,没有捷径。”

努力不会白费

重压之下,有时候一点小挫折就能造成整个人的情绪崩溃。有天早上,许晨光刚坐上班车,同事就发来了照片和信息,“许晨光,你的设备好像出错了,造出了一堆头发来。”同事还打趣,这不是在设计一个艺术品吧。

看着满屏缠绕着的白线,许晨光不敢放大图片,62小时36分钟的努力,全部报废了。本来坐得很挺的许晨光,猛地向椅背一靠,低垂下了脑袋,“什么都想不了,就想赶紧去看看它。”

看着一堆失败的“艺术品”,许晨光反而静下心来,他拿着小铲子把打歪了的零件一点点铲下来,一边铲,一边找原因,铲完废品之后他明白了,打印头温度不够高,并且在一层层叠加的打印中,没有支撑点让其附着,一层出错,全盘皆输。

调整参数和打印速度,增加支撑力,3D打印再一次启动。62小时36分钟的等待,又开始了。

阿里工程师“造人记”

现在,许晨光的机械手臂很灵活了,可以通过手指屈伸完成数字等手势动作,正在完成上臂及肩部组装,从而支持绝大部分手势操作,并通过与语音、手势、屏幕操作的结合,实现AliOS多模态一体化测试框架,落地到自动化测试的日常检测中。

阿里工程师“造人记”

有时候,许晨光会想起美剧《西部世界》第二季中的一个场景,女一号德洛丽丝是个机器人,利用深度学习,定量数据训练以及对抗神经网络,制造并训练出另一个机器人,男二号伯纳德。“比起德洛丽丝,我只是一个制作工具的人。”许晨光说。

阿里工程师“造人记”

郑重声明:此文内容为本网站转载企业宣传资讯,目的在于传播更多信息,与本站立场无关。仅供读者参考,并请自行核实相关内容。

专题报道