-
奇瑞的多媒体系统用起来不用动手?
来源:
   提到车载多媒体系统的语音识别功能,我想大部分用户都会觉得很鸡肋,也难怪,目前很大一部分车载多媒体系统的语音识别功能都仅仅停留在语音命令识别阶段,使用时用户必须通过按钮启动语音识别程序,然后说出命令,而且命令的发音以及词汇必须准确无误,否则识别效果较差,无法获得较好的用户体验。奇瑞为了让用户能够用上更方便更好用的语音识别功能,联合国内语音识别技术领军企业——科大讯飞,开发出了Cloudrive2.0智云互联行车系统,该系统的自然语言处理技术可以让用户光凭口说就能操作多媒体系统的大部分常用功能,而且识别率可达90%以上,下面我们就一起来体验一下这款多媒体系统究竟有多好用?
  
  ● 科大讯飞究竟是何方神圣?
   科大讯飞成立于1999年,由中科大优秀博士生刘庆峰创办,是一家专注于语音技术研发的公司。语音技术包括语音合成技术和语音识别技术。让机器说话,用的是语音合成技术;让机器听懂人说话,用的是语音识别技术。科大讯飞在创立的17年间从事语音相关领域的研究并积累了丰富的经验。连续多年获得国内外的语音技术领域奖项也证明了该公司的技术实力。
  
  
  
  
   科大讯飞走进普罗大众的视野是在2010年,这一年科大讯飞推出了“讯飞语音云”技术。这项技术能够为很多互联网应用提供即时的语音识别支持,如用语音就能完成QQ、短信、微博等内容的输入,识别率高、使用方便使其在业内掀起不小的波澜。
  
   今年10月18日,罗永浩在锤子M1/M1L系列手机发布会上宣布这两款产品将支持讯飞语音输入法,识别率高达97%,基本解决了移动设备的语音输入问题。
  
   在关于讯飞语音输入法的演示中,罗永浩以较快的语速进行随意的语音输入,手机屏幕马上生成准确无误的文字信息。这让科大讯飞瞬间成了锤子新品发布会的主角,使得科大讯飞这个原本默默无闻的科技企业一夜之间成了“网红”。
  ● 是什么催生了拥有强大语音识别功能的多媒体系统?
   我想只要用过旧式语音识别系统的朋友都会抱怨识别率低,除非使用字正腔圆的标准普通话,而且语速还不能太快和太慢,否则无法识别是“家常便饭”。不管是开发者还是用户都知道问题所在,但是要兼容不同地区用户口音差异、让计算机“读懂”人类平时说话时的自然语言最终提升识别率,又谈何容易?科大讯飞用了17年的时间进行技术积累,最终实现了变革,让机器更好地识别自然语音同时把识别率提升至97%。
  
   促成变革的还有性能更强,集成度更高的电脑芯片,它能够让集成了复杂语音识别功能的车载多媒体系统足够小,能够安装到到汽车的中控台内部,同时强大的计算能力让语音识别等待时间达到普通用户可以接受的水平。
  
   4G网络的普及也是变革过程中的幕后推手。通过4G网络,语音识别系统能够随时更新语音库并且在出现本地无法识别的词汇时,通过云端服务器进行识别,保证语音识别系统能够识别当下最新的词汇。
  ● 不仅仅是在多媒体系统上装了一个“牛逼”的语音识别软件那么简单
   屏幕前的你可能会觉得奇瑞的Cloudrive2.0智云互联行车系统只是在普通的多媒体系统了装了个“牛逼”的语音识别软件。这么看就大错特错了。当一个在实验室中识别率达到97%的语音识别系统,用到在高速公路上奔跑的汽车上时,识别率可能会下降到50%甚至更低。因为风噪、胎噪等噪音都会极大地影响语音识别率。
  
  
   为了满足奇瑞的高要求,作为多媒体系统提供商的科大讯飞必须对整套系统的硬件进行各项耐久性测试,保证系统在不同温度、振动的环境中都有良好的稳定性。
  ● 语音识别与车载应用的互联互通为用户带来便利
   车载多媒体系统空有高语音识别率,却不能实现点什么功能也是白搭。科大讯飞通过入股地图引擎公司——美行科技,获得了丰富而精确的地图信息以及千万级的兴趣点信息。通过打通语音识别与导航系统,用户只要说一句“我想吃火锅”,多媒体系统就能自动完成查找导航目的地,然后通过语音确定目的地即能轻松实现导航。
  
   目前,科大讯飞已经与30多个内容提供商实现了合作,我们熟悉的喜马拉雅FM、网易新闻、大众点评、美团等应用都能够与科大讯飞的车载多媒体系统实现互联互通,通过语音以最简单直接的方式进行操作。
  ● 科大讯飞的理想——实现人与机器的无障碍沟通
   科大讯飞已经成功开发出一套被称为AIUI的人工智能交互界面,通过集成双全工技术、麦克风阵列技术、声纹识别技术、方言识别、语义理解技术和内容服务,最终实现人机交流能像人与人交流一样轻松。
  
  ● 是不是真的好用?试过才知道
   在实际介绍试用过程之前,我们首先介绍下目前科大讯飞的该套系统在奇瑞车型上的搭载状况。首款搭载Cloudrive2.0智云互联行车系统的车型是今年3月份上市的奇瑞艾瑞泽5,搭载相同系统的奇瑞瑞虎3X也将在11月15号正式上市。新车将会提供一年免费流量,用于支持多媒体系统上的各种车载应用。流量超了还可以通过银联、微信、支付宝等支付平台,通过扫码方式付款购买流量,价格为10元100MB。根据目前用户的使用状况,绝大部分用户每月流量的不会超过500MB。
  
  
  
   下面的视频演示了奇瑞瑞虎3X多媒体系统语音识别功能。从视频演示中我们可以看到,测试人员可以以正常甚至稍快的语速进行自然语言语音输入,甚至还能打断系统正在播放的语音来进行语音命令的输入,语音识别率较高,测试的导航、音乐播放、电话等功能都无需用户按按钮或者触摸屏幕,实现了光动口不动手的多媒体系统操作体验。
  更多精彩视频,尽在汽车之家视频平台『奇瑞Cloudrive2.0智云互联行车系统语音识别演示』
   据现场技术人员介绍,应用于奇瑞Cloudrive2.0智云互联行车系统的语音识别功能未加入方言的识别,但对于带有方言口音的普通话是能实现较高的识别率的。
  全文总结:
   科大讯飞的语音识别技术确实是走在了世界前列,奇瑞Cloudrive2.0智云互联行车系统语音识别功能对于自然语言的识别率也达到了较高的水平,一些常用的功能基本上通过语音人机交互1-2回就能实现,极大地提高了使用便利性。驾驶员无需看屏幕或者按按键就能实现各种多媒体系统功能,可以更专注地观察路况,提高了驾驶安全性。
   科大讯飞通过技术整合,已经完成了语音技术提供商向语音服务提供商的蜕变。科大讯飞提供的车载多媒体系统由于搭载了其国际领先的语音识别系统,在使用体验上拥有较高的水平。相比起苹果CarPlay功能的语音识别,由于科大讯飞与车企实现了深度合作,其多媒体系统能够与车辆实现更深入的互联,未来还能实现诸如用语音控制车内灯光开关、调整空调等各种功能。作为科大讯飞的合作伙伴,奇瑞也有望成为最先搭载科大讯飞下一代多媒体系统的厂商之一,更先进的AIUI将会使其多媒体系统使用体验再上升一个层次,非常值得期待。
- 兰博基尼
- 兰博基尼(Automobili Lamborghini S.p.A.)是一家意大利汽车生产商,全球顶级跑车制造商及欧洲奢侈品标志之一,公司坐落于意大利圣亚加塔·波隆尼(Sant'Agata Bolognese),由费鲁吉欧·兰博基尼在1963年创立。主要车型有Aventador、Huracan、雷文顿Reventon、盖拉多Gallardo、蝙蝠Murcielago等。
- 劳斯莱斯
- 劳斯莱斯(Rolls-Royce)是世界顶级的超豪华轿车厂商,1906年成立于英国,公司创始人为Frederick Henry Royce(亨利·莱斯)和Charles Stewart Rolls(查理·劳斯)
- 宾利
- 宾利(BentleyMotors Limited)是一家举世闻名的超豪华汽车制造商,总部位于英国克鲁。1919年,W.O.宾利先生创办了宾利汽车公司
- 宝马
- 宝马(BMW)是享誉世界的豪华汽车品牌。宝马的车系有1系、2系、3系、4系、5系、6系、7系、i系、X1、X2、X3、X4、X5、X6、X7、Z4等几个系列,还有在各系基础上进行改进的M系(宝马官方的高性能改装部门)。宝马公司创建于1916年,总部设在德国慕尼黑。BMW的蓝白标志宝马总部所在地巴伐利亚州州旗的颜色
- 法拉利
- 法拉利是举世闻名的赛车和运动跑车的生产厂家,总部位于意大利马拉内罗(Maranello),由恩佐·法拉利(Enzo Ferrari)于1947年创办,主要制造一级方程式赛车、赛车及高性能跑车。法拉利品牌法拉利所使用的传奇标志有着非同寻常的起源
- 特斯拉
- 特斯拉(Tesla),是一家美国电动车及能源公司,产销电动车、太阳能板、及储能设备。 总部位于美国加利福尼亚州硅谷帕洛阿尔托(Palo Alto)。 特斯拉第一款汽车产品Roadster发布于2008年,为一款两门运动型跑车
- 奔驰
- 梅赛德斯-奔驰奔驰,德国百年汽车品牌,汽车文明的先驱者与引领者,被认为是最成功的高档汽车品牌之一,其登峰造极的技术水平、精湛过硬的质量标准、推陈出新的创新能力、以及一系列经典轿跑车款式令人称道,车系有A级、B级、C级、CL级、CLK级、E级、S级、SL级、SLC级、SLK级、SLR级、G级、GL级、GLK级、M级、R级、AMG车系等。
- 保时捷
- 保时捷(Porsche)是一家德国汽车生产商,又叫波尔舍,总部位于德国斯图加特,是欧美汽车的主要代表。主要车型有911、Boxster、Cayman、Panamera、Cayenne、Macan。1931年,保时捷成立于斯图加特,以生产高级跑车闻名于世界车坛