1智能机器人三大核心技术模块:感知+交互+运控
整个服务机器人产业建立在三大核心技术模块:人机交互及识别模块、环境感知模块、运动控制模块。依托于三大模块,机器人有基础的硬件:电池模组、电源模组、主机、存储器、专用芯片等,还有操作系统:ROS、Linux、安卓等;由硬件和操作系统构成机器人整机,整合基础硬件、系统、算法、控制元件,形成满足一定行走能力和交互能力的机器人整机;在此基础上形成各种基础应用开发,基于机器人操作系统开发的控制类APP、管理员APP和各类应用程序App等;产生的数据将有群组服务、云服务、大数据服务等。
服务机器人的交互能力、感知能力、运动能力对应三大模块。交互模块包括语音识别、语义识别、语音合成、图像识别等,相当于人的大脑;感知模块借助于各种传感器、陀螺仪、激光雷达、相机、摄像头等,相当于人的眼、耳、鼻、皮肤等;运控模块包括舵机、电机、芯片等。
服务机器人的各个细分模块中,语音模块重要性和成熟度均最高,语义模块是目前突破重点,运控模块相对重要性最弱。服务机器人三大模块可以继续细分为语音模块、语义模块、图像模块、感知模块、运控模块、芯片模块。重要性排序依次为:语音模块、语义模块、芯片模块、图像模块、感知模块、运控模块。成熟度重要性排序依次为:语音模块、图像模块、运控模块、感知模块、语义模块、芯片模块。
从技术储备上来看,人工智能是核心。目前的技术储备方面,只有语音和OCR领域具备一定的成熟度。语音和OCR领域已发展接近20年,在某些特定场景和行业已经有了一些数据基础。其他的技术包括图像识别、语义分析都还在很早期的阶段。语音领域,也是目前已知的平台类企业最大的板块。
2服务机器人多场景特征,多模态交互融合是关键
从第一代以鼠标和键盘的交互方式为特点的PC互联网,到第二代以触屏、GPS等交互方式为特点的移动互联网,再到今天以多模态人机交互方式为特点的第三代互联网,服务机器人产业,底层的逻辑就是人机交互方式的发展和演变。
随着语音交互、视觉图像交互、动作交互、脑电波交互等多模态人机交互技术的逐步发展和成熟,这些第三代人机交互方式将会深层次地改变我们日常生活的应用场景;同时,一场第三代互联网的主流终端模式和服务内容入口的竞争也在同步进行。
什么是多模态交互?多模态融合了视觉、听觉、触觉、嗅觉等交互方式,其表达效率和表达的信息完整度要由于传统单一的交互模式。人机交互是服务机器人场景化不可或缺的环节。传统的交互模式中,大多是单一单向的交互方式。人机对话中,尤其是多轮人机对话,涉及到语音理解、语义分析、情感分析、动作捕捉等多个维度。