科大讯飞要当智能汽车领域的独角兽

白癜风专家李从悠 https://m.39.net/disease/a_5481259.html

最近网络上发酵的科大讯飞“AI同传造假”,再次将这个中国智能语音产业领导者推向了舆论的风口浪尖。这个由一群科大有志青年成立的公司,经历了近20年的发展,其核心的语音智能技术到底给我们的生活带来了什么改变?

造假事件来龙去脉

9月20日,担任年创新与新兴产业发展国际会议(IEID)的官方同声传译人员BellWang在知乎发文爆料,称科大讯飞的智能翻译同传是利用人类翻译内容假冒机器同传。而当时现场直播平台“知领直播”的官方描述是“本次国际会议引入了科大讯飞智能语音技术,实现了国际会议中的智能翻译和自动语音播报”,并未提及会议现场也有专职的同声传译人员。

现场图片显示,会议中演讲者身后PPT下方两块区域分别显示中英文文字,“知领直播”称这是科大讯飞的“讯飞听见”智能识别出语音后转录的文字。比如演讲嘉宾讲中文,屏幕会实时显示“讯飞听见”的语音转文字功能识别出该演讲者的中文,以及经过其翻译的英文,反之亦然。BellWang爆料这部分文字内容实际是其现场同传翻译而来,并非讯飞的人工智能翻译。

随后,科大讯飞官方发布声明,宣称从未宣传人工智能翻译,“知领直播”平台未能做好相关说明工作,而导致了相关方面的误解。科大讯飞解释当天会议主要应用的是其智能语音识别技术,能够快速准确地将演讲者和同传工作人员的语音转化为文字。称这是人机耦合,极大地帮助同传者提升工作效率,认为讯飞没有主动作假行为。这样的官方声明颇有点意思,仿佛在说现场的翻译就是这么显示的,有中文,有英文,至于你怎么解读,就是你的事情了。反正我没有主动说这是也没有说这不是“讯飞听见”语音智能识别和翻译的。

当前最好用的智能语音输入法:讯飞输入法

科大讯飞语音智能最常见的应用是讯飞输入法。一次偶然的机会,在朋友的推荐下,我抱着试试看的态度在手机上安装了讯飞输入法,经过试用才发现语音识别竟然能如此精准。这语音输入法的使用体验要比在我们常用的手机屏幕上用26键拼音输入的体验好太多,再也不用嫌弃键盘按键太小,经常误操作了。再也不用担心走路打字会撞到电线杆了。再也没有双手拎着东西,没法打字回复信息的尴尬了。

讯飞输入法用智能语音识别技术解放了我们的双手,让我们可以彻底抛弃某狗输入法。讯飞输入法在特定场景或群体的应用,可以极大地提升我们的工作、学习和生活效率。第一类是手眼不适宜打字输入的人群。比如中老年人、残疾人、受教育程度较低人群等。语音输入是最适合他们的输入方案,特别是讯飞输入法目前已经可以强大到识别包括粤语、四川话等24种方言。第二类是不适宜使用手眼打字输入的场景。如走在路上、正在开车、会议速记、旅行手记、保护视力等。

科大讯飞布局前装系统,抢占汽车多媒体市场

科大讯飞汽车事业部总经理刘俊峰曾发表过题为《如何构建AI时代的智能汽车交互生态》的主题演讲。对于汽车智能化趋势,他提出了双重维度的观点,即“理解环境”和“理解人”。他认为现如今大多自动驾驶研发公司都在面向“理解环境”进行研发迭代,最终向完全自动驾驶技术发展,即让汽车成为“自动驾驶车”,而他认为,“理解人”是智能化的另一个维度,最终让汽车成为“情感化汽车”,只有这两者的结合才是真正意义的智能汽车。

这是概念化的顶层思考,但落实到市场,一家技术公司摸爬于供应链体系固化的传统汽车领域,如何选取一个适当的切入点,才是现阶段的当务之急。而科大讯飞核心的AIUI开放平台,它是其研发的以语音识别和人工智能相结合,使得人工智能产品都能在AIUI界面上操作,未来场景下,人、智能手机、智能机器人、智能穿戴产品、智能汽车都可能在这个AIUI开放平台中实现人机交互,创造一个全新的人工智能世界。

这些技术都需要适当的硬件载体去实现功能。在汽车领域,科大讯飞正在同国内主要汽车制造商和一级供应商合作,布局汽车前装市场,抢占汽车智能多媒体市场。当前汽车多媒体市场,用户体验实在是太差了,功能大部分被体验更好的智能手机所取代了。各大主机厂投入巨资研发的价格不菲的多媒体系统,居然被路边小店随处可见的10元车载手机夹给打败了。甚至有部分厂家,如上汽大众在其新一代朗逸的部分车型上,直接取消了多媒体屏幕,取而代之的是手机夹子。

是广大汽车用户不喜欢车载多媒体吗?是智能手机功能太强大吗?不是,是我们的车载多媒体系统太弱,用户体验太差。车载多媒体这一细分市场,正好满足了“正在开车”这一不适宜使用手眼打字输入的场景。

科大讯飞自从成立汽车事业部以来,投入巨大,团队人数已经达到多人。科大讯飞目前在汽车前装领域,主要是同整车厂和一级供应商做好语音交互产品规格的定义,相当于科大讯飞对外输出平台和技术。整车厂和一级供应商再按照产品规格的定义来做更好的产品集成和落地应用。目前科大讯飞基本同国内所有的整车厂进行了合作,试图将科大讯飞的标准产品规格融入到不同品牌、不同车型、不同供应商的体系中,整个系统工作量极其巨大。

年7月,科大讯飞与吉利汽车在合肥签署战略合作协议,全方位提升吉利汽车的人机交互体验。率先在吉利的博越SUV上搭载“吉客智能生态系统(GKUI)”,目前吉利18款车型大部分已经搭载该系统。

年3月,科大讯飞宣布与长安汽车合作,开发出“小安你好”智能语音交互系统,主动识别和判断用户潜在需求,实现人与车辆的双向交互。目前已经搭载在CS75、CS95等车型上,计划未来覆盖旗下所有车型。

年4月,科大讯飞宣布与宝马合作,基于宝马iDrive4.0版本的“社交互联”APP中加入深入定制NLU语音技术,为APP实现了利用自然语言理解技术搜索目的地和兴趣点功能。目前该技术已经率先搭载在宝马3系车型,通过方向盘上实体按键启动,用户体验要比“嘿Siri,你好XX”要好得多。

目前虽然科大讯飞在汽车多媒体系统领域更多的扮演核心技术和算法的幕后角色,各大厂家在其基础上进行二次开发,以各自的市场品牌来进行推广。但我想一个如此好用的产品,一定是能够被广大用户所感知到和喜欢的,一旦科大讯飞语音智能产品拥有了大量的习惯客户,很有可能会成为车载智能语音多媒体系统领域的独角兽公司。而畅想未来,科大讯飞是否会自行构建统一的软硬件结合平台,从底层技术设计、硬件融合、用户管理等形成一套完整的体系。未来,可能我们每个人可能只需要一个属于自己的智能设备。当我们在家的时候,它会是我们的智能管家,接入智能家居系统,根据我们每个人的个人喜好,来调节温度、湿度等居家体验指数。当我们出门在外,它会是我们的智能通讯工作,替代我们当前的手机、平板、电脑功能。当我们在驾驶交通工具,它会是我们每个人的人机交互平台,只要将这个设备接入交通工具,就可以智能判断出我们的目的地并自动规划出最佳路径开启自动驾驶等。未来,科大讯飞能否从底层技术供应商升级为汽车Tier1(一级供应商)?乃至我们梦寐以求的智能生活的筑梦者。让我们拭目以待!

文章内容和图片部分内容来源网络,版权归属原作者。



转载请注明地址:http://www.1xbbk.net/jwbzn/9203.html


  • 上一篇文章:
  • 下一篇文章: 没有了
  • 网站简介 广告合作 发布优势 服务条款 隐私保护 网站地图 版权声明
    冀ICP备19027023号-7