NEWS CENTER
上个月,“世界机器人大会”在北京亦庄召开,作为机器人行业最大盛会,众多参展机器人让人大饱眼福,也透露出了行业新风向。除了前几年常见的的扫地机器人、娱乐机器人、陪伴机器人等服务机器人之外,我们还看到了大量新兴的配送机器人、巡检机器人和工业机器人。
雷锋网还注意到一家做嵌入式人工智能解决方案公司——“米文动力”,他们不生产机器人,主要提供机器人的“大脑”。米文动力告诉雷锋网,服务机器人行业遇冷,如今配送、巡检、工业机器人重新焕发活力,依赖着机器人底层技术能力和场景解决方案的升级,同时也提出了很多新的挑战。
(米文动力CTO苏俊)
在大会后,雷锋网特意拜访了米文动力,与CTO苏俊深入探讨目前新兴的机器人技术、解决方案和落地场景。
云端AI与嵌入式人工智能
据了解,米文动力成立于2015年,致力于提供一站式、端到端、软硬件一体化的人工智能机器人整体解决方案,该方案以嵌入式人工智能超级计算机——米文大脑为核心主控,集成机器人必备的自主感知决策、自主定位及导航,为个人开发者、机器人厂商、传统厂商提供不同程度的定制化方案,帮助他们轻松打造机器人。
2015年,机器人正火,很多人都涌进来想要做机器人。
苏俊告诉雷锋网,2015年,机器人行业还处于最原始的时候,整个系统架构还是第一代机器人的状态,主要形态是一个实时系统加上一个安卓操作系统。同时机器人行业产业链也不成熟,很多公司选择全链条都自己做,把技术战线拉得很长,导致整体技术发展缓慢。后来,行业里的人慢慢开始发现,机器人系统很复杂,其实机器人公司应该关注的是产品、市场和客户,可以把底层的比较难的技术问题交给擅长的公司来做。
当时,机器人还没有一个嵌入式的智能控制平台,人工智能的主要实现方式是云端AI,设备通过网络将数据传到云端,在云端计算后再将数据传出,云端AI的算法准确率高、算力强,但是云端AI对机器人并不是最好的方案。机器人一般具备多种传感器,需要在复杂多变的环境下做出实时响应,云端计算会带来延迟和卡顿问题;同时,在家庭环境下,数据隐私尤为重要,需要家庭中的机器人在不联网的状态下也能正常运行。机器人行业迫切需要在本地对较大数据量进行实时处理和响应。
在这一背景下,米文动力成立了。创始团队成员有多年英伟达GPU平台的研发经验,他们在成立之初就定位为英伟达在GPU平台的技术解决方案提供商,基于英伟达Jetson系列平台来做嵌入式人工智能。
2016年4月,英伟达发布Jetson TX1嵌入式计算平台,专为当时热门的AI人工智能产品化而生,Jetson TX1可为小型设备提供桌面级GPU的通用运算性能,有助于新兴的无人机、机器人、智能车载等初创企业的产品研发。作为英伟达的战略合作伙伴,米文动力同台展出了基于Jetson TX1的嵌入式人工智能计算机“米文大脑”,以及合作伙伴的机器人产品—— sDeno家用服务式机器人,其能在家庭中完成基本的管家型工作,如跟随移动、动作交互等,另外可以利用Jetson TX1带来的学习能力,学会用户交给它的任务。
(米文大脑S2)
米文大脑是米文动力的核心产品,目前已经迭代到第二代——米文大脑 S2,基于NVIDIA JETSON TX2。S2的尺寸为97 mm ×60 mm ×40mm ,与前一代米文大脑相比,体积缩小了约 30%。功能方面,S2 提供免费的 Linux 层面的人体、物体相关算法的SDK,包括但不限于人脸检测,身份识别,属性识别,年龄识别、物体识别等。
苏俊告诉雷锋网,米文大脑S2从操作系统层到算法层都针对嵌入式硬件做了大量的深度优化。嵌入式人工智能和云端AI有很大不同,云端AI的难点主要是算法,而在终端实现AI则会发现软件只是最上层,基石其实是整个系统和硬件,如果基石不稳的话,虽然软件可能是最能出彩的地方,但依然没有办法发挥出来。在苏俊看来,米文动力是软件和硬件都擅长的团队,突出优点是对整个系统的理解和整个GPU优化能力。
米文大脑 S2的核心技术分为硬件和软件两方面。
硬件方面,因为深度学习终端应用环境各不相同,所以从整个硬件设计上要比消费类电子产品要求更高,米文大脑的接口的保护、电路设计都要以工业标准来要求自己。
软件方面,最突出的是针对GPU的特性对大家现在比较常用的算法进行很强的加速,米文大脑 S2 能将 Mobilenet SSD 的性能提升5倍以上,原来不做任何工作的话,在硬件上只能跑到7-8次/秒,但当做了核心优化时,速度能到40次-50次/秒。
此外,米文动力会根据不同行业提供完整的解决方案。比如机器人行业对多个传感器的时钟同步有非常高要求,传统方式只能另外再拿一个硬件做时钟同步,并且把它的数据接入到另外计算单元里面。米文动力在一个设备里实现了这些功能,集成度非常高。
室内机器人与室外机器人
虽然市面上已经有这么多的机器人,但是与已经成熟的单点的人工智能技术,比如计算机视觉、语音识别相比,机器人才刚刚蹒跚学步。
这对米文动力这样致力于提供机器人底层技术的公司来说,最明显的挑战就是,他们不能只是提供一个固定的硬件,他们还需要根据不同的新兴场景,定制不同的落地方案,为机器人集成多种能力。
视觉是机器人最重要的感知系统,也是每个机器人必备的功能。米文动力自己研发了一套基于深度神经网络的智能视觉系统架构,能实现人脸识别、人脸追踪、物体识别、动作识别、手势识别等功能。定制不同的落地方案,为机器人集成多种能力。
目前,这些CV技术已经成熟,为何还需要米文动力重新研发呢?苏俊解释到,机器人的视觉系统很复杂,最后实现出来的功能不是单个算法组成的,而是一套算法系统,并且集合一些非算法的逻辑来完成整个功能。直接采用现有的算法,达不到整个功能的要求,并且这个新的算法在很多场景已经作出了一些限制,没有办法满足机器人特定场景的一些需要。
这两年,机器人的落地场景也发生了一些变化。今年世界机器人大会上的服务机器人数量较此前大大减少,大家逐渐从纯交互的服务机器人上转到带有一些功能性的机器人和落地场景,例如米文动力现在主攻的配送机器人、巡检机器人、工业机器人、工业视觉检测、视频智能分析。
视频智能分析则是泛化的机器人概念,可以利用米文大脑的强大计算能力和低成本去做一些纯视觉的工作。
配送机器人、巡检机器人都是室外机器人,对核心计算和整个系统可靠性要求很高。室内机器人和室外机器人的导航算法、传感器也都不一样,室内会用单镜头激光器+摄像头,在室外更多会使用多镜头激光器+摄像头。另外传感器接入方面,室外的会用一些传统的监控用的摄像头,室内会用USB的摄像头或其他密闭接口的摄像头。巡检机器人也可能工作在室内,也可能工作在室外,这个时候同一种巡检机器人也可能有不同的方案。
不过现在室外机器人的方案还不够成熟。京东或菜鸟都有在做室外的配送机器人,并且做的时间比较长,声量比较大但销量并没有到一定程度,为什么?其实室外机器人有一个很大的痛点,其对硬件的要求接近于自动驾驶,外界环境更复杂,这就要求整个内部系统设计需要做一个非常特殊的设计,看上去不太起眼的抗震性设计、车危及人的设计,成了目前这个领域更往前走一步的阻碍。
米文动力的室外机器人方案场景需要2个米文大脑S2。据苏俊透露,米文动力也正在研发基于英伟达下一代Xavier计算核心的第三代产品米文大脑Apex,产品的计算能力相当于第二代10-30倍,是非常适合室外场景的一个核心控制单元,能够解决以上提到室外机器人面临的问题。
AI芯片与通用GPU
人工智能对算力、算法要求很高,很多人工智能公司都在自研芯片。2018年,语音技术公司,包括科大讯飞、云知声、思必驰、出门问问等都在做语音AI芯片,期待以专用芯片来解决AI算法和算力上的瓶颈。雷锋网编辑好奇,AI芯片方案是否会比米文大脑利用通用GPU方案更适合机器人呢?
苏俊告诉雷锋网,目前很多做产品的公司去做芯片,方向上是好的,因为产品公司对业务场景理解最深刻,能直接体会到现有的芯片的不足,当产品达到一定的量的时候,他们会选择自己去做芯片,一方面降低成本,另一方面更符合自己的需要。通常去做一款芯片的话,起码产品要有千万级别的量,但机器人离这个数量还差得非常远。所以现在的机器人公司还没有必要去做自己的AI芯片这些方面。
机器人其实需要的是一个更加强的计算能力的芯片,目前大部分AI芯片为了平衡功耗和它作为一个后入者切入,目标瞄向一些功耗和计算平衡的方向,这个方向其实并不是机器人方向需要的。另外机器人上面需要的算法非常多,所以现在更需要的是计算能力比较强的一个接近通用计算的平台。
自动驾驶需要有一个计算能力很强的核心能力,但不一定需要是一个专用AI芯片的概念。特斯拉这样的公司依然使用基于英伟达的Hardware 2.5核心硬件,依然是通用计算的平台。 在研发成本方面,如果要采用AI专用芯片,需要学习各自底层的语言与工具链,研发成本比较高。而GPU最近十几年的时间在并行计算整个生态里,并且开放了像CUDA这样一些工具,在工程师资源上有了很大的积累,意味着各个产品公司在嵌入式GPU上进行开发的难度和资金投入会远远低于用一个新的AI芯片。
综合这几个因素,苏俊认为现在的嵌入式GPU更加适合机器人这种形态的,而且它可能比较难遇到特别强的竞争者。
人工智能对算力、算法要求很高,很多人工智能公司都在自研芯片。2018年,语音技术公司,包括云知声、思必驰、出门问问等都在做语音在采访的最后,苏俊也谈到,人工智能时代是技术创业的时代,与互联网靠流量红利创业已经截然不同。AI的数据、算力、算法对硬件和软件都提出了同等强烈的要求,近来很多公司开始AI公司做芯片、做服务器,也是需要提高自己的计算力、降低成本,同时以硬件作为通道去占领市场。