日期
02/06
2018
咨询
  • QQ扫一扫

  • Vision小助手
    (CMVU)

搜狗AI开放平台推出语音视觉整体终端方案
收藏
2018-02-06 16:26:32来源: 中国机器视觉网

  搜狗AI开放平台与人工智能新贵Kneron共同推出整合了搜狗语音交互方案、Kneron机器视觉的在离线终端人工智能解决方案,可应用在智能家居、智能安防、车载、机器人,以及各种物联网领域……该解决方案将搜狗领先的语音、自然语言理解技术与Kneron的机器视觉技术整合在同一个终端设备上,在离线状态下,能在终端设备上进行智能运算,以满足实时、安全的需求;也可实现云端连接,执行更多指令,以打造一个在离线视觉+语音交互的智能平台。

 

  搜狗AI业务部门负责人表示:搜狗AI关注自然交互和知识计算两大方向,在语音、机器视觉、机器翻译和问答方面已经取得了重大突破,并长期服务于搜狗的产品,例如搜狗输入法等。AI技术要实现产品化并找到应用市场,必然要结合行业才能走下去。搜狗AI开放平台希望结合场景把需求做好,将AI技术转化为业务落地,重点将AI技术做成解决方案服务行业,目前已经把技术和解决方案应用在公检法、金融、军事、互联网、物联网、智能硬件、车载等领域。搜狗将与合作伙伴一起拓宽AI技术的应用范围,积极与各行业SI系统集成商、ISV软件服务商以及AI生态链里的各类合作伙伴,例如云服务商、硬件厂商、物联网、数据服务商、AI/AR/VR/MR等科技公司一起打造垂直领域的解决方案,实现AI商业化落地。

  Kneron创始人暨执行长刘峻诚表示:“在离线语音交互+视觉终端人工智能解决方案为人工智能应用开拓更多的应用与可能性,也提供一个终端与云端人工智能有效分工的示范架构。此外,在不需要额外的硬件资源下,Kneron的终端影像人工智能平台即可结合搜狗的语音交互技术,显示Kneron终端人工智能技术的可重组与整合能力,以满足轻量化、低运算需求。”

  基于搜狗“知音”引擎输出的语音交互方案,致力于让人机交互更加自然,不仅“能听会说”,还具有“能理解会思考”的能力,凭借互联网公司的天然优势以及多年来的数据和技术积累,搜狗的“知音”引擎可以做到识别速度更快、纠错能力更强、支持更加复杂多轮的交互以及更加完善的服务能力,可同时支持在线、离线功能。语音识别准确率高达97%以上。

  Kneron机器视觉解决方案基于Kneron独家的可重组式人工智能神经网路(Reconfigurable Artificial Neural Network)技术,可以针对不同的需求快速调整功能,以满足不同的终端人工智能应用。此解决方案可即时识别人脸、人体、距离、数量,以及手势和动作,然后根据识别结果进行回应。整合搜狗的语音交互方案后,除了机器视觉外,还可以通过语音指令,实现人机交互需求。这些人工智能运算在离线环境下即可进行,尤其适合需要即时回应与考虑个人隐私安全的应用,此外,因为具有深度学习能力,因此会根据累积的经验作调整,让回应越来越精准、人机互动更自然。

  以智能家居为例,当人进入室内后,该视觉+语音交互在离线终端人工智能解决,进入此空间,空调设备就可以根据增加的人数、是老人或小孩,自动调整温度、风量、风向,如果进来的是陌生人,还能主动发出通知给户主。然后,可以透过语音指令,开启电视并选择频道,或是播放音乐、调暗或调亮灯光,以及告诉系统要连接结到云端,查询资料、搜寻天气和交通讯息、订购餐厅和机票等。

  在车载应用上,在离线语音交互+视觉在离线终端人工智能解决方案可以使用在车内智能后视镜或车用娱乐系统等车载设备,通过手势侦测或语音指令,开启或关闭行车记录仪、音乐播放、灯光、导航、搜寻等功能,或调整远灯、近灯,避免驾驶者分心,以提升行车安全。

  再比如,在离线语音交互+视觉终端人工智能解决方案赋能给机器人,就相当于给机器人装上了“眼睛”和“嘴巴”和“大脑”。当机器人通过语音识别收到“救命”等求信号时,或通过暴恐识别、人脸识别判断出暴恐、嫌疑人时,就会做出相应反应,通知指挥人员。指挥人员通过语音或手势发出指令,机器人随即执行指令并进行相应处理。在家庭或VIP服务区域内,机器人通过人脸、手势、语音等识别,和用户直接互动。

为你推荐