本篇文章2000字,读完约5分钟

今年八月,雷锋。在空盛会召开之前,com将举办一场具有全球影响力的人工智能和机器人创新大会。那时,雷锋。搜索“雷锋”。将发布“人工智能与机器人创新企业25强”名单。目前,我们正在走访人工智能和机器人领域的相关公司,筛选最终入选的公司名单。如果您想加入我们的名单,请联系:2020@leiphone。

赵,上海交通大学人工智能博士,阅读技术首席执行官,原阿里巴巴北京算法研究中心主任,高级算法专家;怀斯纳特R&D中心算法部前主管,致力于人工智能领域的算法研究超过15年。

去年7月,赵觉得时间差不多了,于是他带着、宋向明和创办了上海棉读科技。这四位创始人是认识两年多的朋友。

该公司的英文名称是“readsense”,中文名称也是简单的“reading face”。技术人员的典型命名风格简单明了,一目了然。然而,从名字可以看出,这家公司很可能从事人脸识别。不过,赵更愿意按照自己的话来介绍面读。“一家人工智能技术公司,通过深度学习和计算机视觉技术,让智能机器从一个全新的视角看世界。”

至于智能机器的定义,每个人都会有自己的标准。手机是一种智能机器,每个人都同意,但虚拟现实头盔?在赵井磊看来,新一代机器人,如家庭伴侣机器人和清扫机器人,包括一些可以与智能电子设备相关联并与人们生活密切相关的东西空,可以被定义为消费级智能机器,包括ar和vr。他指的当然是一台一体机。我认为没有必要讨论一个盒子。

除了单口相声 机器人还得能“阅面”识人

那么为什么机器应该有一个新的视角?目前,机器人行业面临的最大瓶颈在于人机交互。语音是目前大多数人认为最好的交互方式之一,也是业内采用最多的交互方式。语音学注重听、说、读、写,而相声依靠学习和唱歌。如今,许多做语音交互的公司都非常强大,所有采用他们的方案的机器人都能说很好的相声。但是黑眼说唱单口相声能活多久呢?机器人视觉可以为更多的交互方式提供基础,如人脸识别、手势识别、行为(姿势)识别和环境识别。与言语相比,视觉也有更深的含义。视觉使机器人能够被动地接收信息,主动地观察周围的环境,主动地观察与之接触的人和他们的行动,然后做出一些更加个性化的反应,这也是机器人智能化的基础。

除了单口相声 机器人还得能“阅面”识人

有了视觉,智能机器可以更好地理解人。它可以通过识别你的脸来找到你,通过识别环境来定位你的位置,通过你脸上的表情来解读你的情绪,识别你的手势或行为指令,并更有效和有目的地与你交流。

赵说,视觉算法中使用的主要技术之一是深度学习,但是深度学习现在面临着另一个问题:效率低。通过云处理数据的解决方案不能保证机器在任何时候都能快速准确地处理数据,尤其是在复杂的网络环境中。因此,他找到了美国卡耐基梅隆大学机器人研究所的前研究员和东南大学计算机视觉博士丁小雨,来优化视觉算法;前百度高级工程师宋向明来做架构,不仅解决了准确性和效率的问题,而且通过大量的前端工作,使得离线阅读产品比api云服务产品更可靠。人脸识别和表情识别等深度模型被压缩到很小,它们可以在嵌入式低端arm系统上实时工作,而无需依赖gpu。

除了单口相声 机器人还得能“阅面”识人

就在我们可以为做图像识别的软件公司下结论的时候,我们发现他们已经开始做硬件了。这个产品的名字叫roboeye,你一眼就能猜出它是什么:照相机。

视觉是一个复杂的系统,可能需要更好的传感设备来获取更多的环境信息。你为什么去硬件?给赵的解释是,如果你自己去找硬件,你就能知道什么样的设备能给我们提供更多的信息(深度信息),更快的计算能力和更少的能耗。另一方面,在人脸检测中,有许多备用功能。以检测为例,要求机器始终能够检测是否有人脸、手势、人体框架甚至周围环境的变化。为了降低功耗并进一步提高计算效率,摄像机的硬件配置可以与其自身的软件紧密结合,集成操作可以达到最佳解决方案。例如,通过双目摄像机,我们可以增加对距离的感知,并做出更好的路径规划和导航。

除了单口相声 机器人还得能“阅面”识人

目前,阅读产品分为两部分,一部分是算法层,另一部分是硬件层。算法层可以完全基于软件层,只需要集成。如果你只需要软件产品,例如,你的相声机器人现在需要一个面部识别或手势识别,那么你只能集成sdk。硬件层主要针对需要深度建模且对计算性能有很高要求时,通过读取表面给出的优化方案。

“罗基、小白公子等。主要使用相关的视觉算法sdk产品,包括readface、readhand等产品。

计算机视觉和深度学习需要人才积累和海量数据叠加,而人工智能算法是一个长期的优化过程。因此,在市场上面临阅读的对手仍然非常强大,如果没有他们自己的优势,他们可能每分钟都被杀死。

赵表示,嵌入式深度学习模型和深度学习模型压缩加速技术是他们目前最大的技术优势。另外,他们在表情识别、手势识别和行为识别方面有一定的优势,而高效的fpga加速技术是他们手中的利器。

胜利,而不是傲慢;输,不要灰心。阅读,没完没了;脸,一切。

赵想成为视觉识别行业的IFlytek,让智能机器人不仅能说相声,还能看世界。

标题:除了单口相声 机器人还得能“阅面”识人

地址:http://www.j4f2.com/ydbxw/12840.html