-
小P更拟人/有情绪 小鹏汽车新语音系统
来源:
   最初驾驶员只能通过物理按键、旋钮对车辆下达指令,别无他法。随着智能网联汽车的发展,“语音助手”已经渐渐成了人机交互的重要方式,而面对未来的自动驾驶时代,语音交互似乎要有更高的地位;即便是现在,小鹏汽车给出的数据显示,用户的智能语音日常使用率在90%以上。怎么把大家爱用的语音系统做到更好?小鹏汽车即将用一次OTA给出答案。
  
   此次OTA的推送只针对小鹏汽车P7(参数|询价),P7最早于2020年4月27日上市,截至2021年6月份,该车累计销量已突破3万辆。除了706km的NEDC续航里程比较傲人外,该车的辅助驾驶能力、语音识别系统都有出色的表现,比如小鹏P7的辅助驾驶具备高速NGP能力,其语音系统具备全场景语音能力,此次新语音系统的升级会为其锦上添花。
  
  ●新语音系统有了什么变化?
   小鹏汽车将于2021年7月份下旬通过OTA向P7全系车型推送此次的新语音系统,此次语音系统最重要的变化点就是语音助手拥有更加拟人化的音色,同时可实现具有情感变化的声音输出。至于语音助手的反应速度、识别率、功能实现等方面,新系统基本保持和此前一样的水平,并不会有显著优化。
  更多精彩视频,尽在汽车之家视频平台
  『小鹏汽车全新语音系统官方展示视频』
   其实此次语音系统OTA的目的很好理解,就像我们能为小P换装、换头像一样,都是提升人机交互体验、提升情感交流的一种途径。对于传统意义上的语音助手来说,它可能只是用来帮你完成功能操作的机器人,话术死板、音色机械感强、没有情绪变化;且不论语音助手的功能性是否强大,面对一个“纯正的机器人”,你有欲望和它交流吗?那如果语音助手的发音像个真的“小秘书”一样,结果是不是不同?
  
  
   这次的新语音能做到什么水平呢?首先是音色和音质,音色我们可以通过上面的视频大致有一个了解,这种拟人化水平确实和目前其它汽车语音助手有了很大的区分,与此前的小P对比,也是大大削减了机械感。至于音质,小鹏汽车官方称新声音采用了24K采样技术,实现了高保真音质。
  
   针对音质和音色水平,我们有一个参考,微软MOS语音质量评测是一项国际通用的语音质量评测方法,与真人、机器人声音相对比,越大程度接近真实人声就能获得越高分数,满分5分,小鹏汽车的新语音助手获得了4.49分,官方称这是目前MOS评测中得分最高的车载智能语音助手。不过小鹏汽车也提到,这套MOS评测体系也仅是主观评测,可供参考,但从专业角度来说,并不代表100%的准确。
  
   另外,官方分享称,此次升级后的语音助手可以表达情绪变化。现在所有的汽车语音助手都是单纯的将文字转化为语音而已,“语气”平和毫无变化,但“新小P”将具备愉快、温和、亲热、抒情、严肃、不满、生气、害怕、悲伤、冷静等14种强烈情绪的变换能力,可以实现情绪变换、语速变化、抑扬顿挫等;这些会增强语音助手的拟人化属性。不过我预计类似情绪转换的能力可能还是只覆盖部分内容,并不会实现全量的覆盖。
  
   小鹏汽车称目前这套语音系统也具备“针对实际情况来自行调节语速、情绪”的能力,但这个能力离真正上车还有一段距离,仍需要后期不断培养、调整。目前为止,我们只有官方的示例视频来参考,新语音系统的实际体验会如何,我们会在7月下旬为大家带来分享,请期待。
  ●小鹏汽车怎么实现的这些变化?
   小鹏汽车的语音系统此次是使用了“超大规模在线神经网络引擎+小型离线拼接引擎”的技术组合,这是实现新语音的关键因素之一。不过这个方案对于运算量、时延、网络抖动、与应用相结合、声音一致性等问题都有着较高的研发工作量、研发难度,所以如此的技术方案并不是目前车企们的普遍选择。
  
   “在线神经网络引擎+离线拼接引擎”能为语音系统带来什么帮助呢?首先是发音方式、质量,新语音助手的所有发音均由AI合成,现在部分语音设备的拟人化音色可能是通过录音实现的,一旦涉及前期没有进行过录制的内容,呈现出的声音就会有差别,AI合成就避免了这点。另外,常规离线引擎的运算体量不是很大,带来的弊端就是声音质感一般,而小鹏汽车此次用到了云上引擎,巨大体量的运算能力可以支持高质量的声音输出。
  
   在沟通会上,我们也提到,新声音是否会对网络有强需求?一旦在地库或隧道等场景中断网,语音系统会不会降质?官方称新语音对网络的依赖较小,如果遇到严重的网络抖动等情况,语音系统会用到离线引擎做保底,那时候的声音确实会被降质,小鹏汽车研发人员表示,在前期测试中,这种情况发生的比例很低,可能也就1%、2%左右。实车表现如何,后续我们也会为大家带来实际体验。
  ●关于新语音系统的其它好奇
  
   从小P的角色定位、情感需求等角度出发,小鹏汽车内部从多种音色中选出了现在的小P。目前语音系统不支持在几种不同音色的拟人化语音中进行切换,因为小鹏汽车认为,很难将每个声音都打磨到非常好,这其中对AI训练量、服务器占用、延迟的缩小等诸多方面都有较高要求,所以“打磨出一款好声音”比“个性化”的优先级更高。
   不过作为彩蛋,研发人员称在某些功能、某些情景下,小P还是会有少数不一样的情绪、声音出现,这要靠用户自己挖掘了。
  
   小鹏汽车的研发人员表示,他们内部也考虑过这个问题,但除了技术难度、成本以外,还有小P的定位要思考,小P是个助手?秘书?还是用户的亲人?用户会不会希望一个亲人或朋友的声音出现在语音系统中?针对这些问题,小鹏汽车还在思考中。屏幕前的朋友,你们怎么想?
  
   截至目前,这套语音系统仅会在小鹏汽车P7上全量发布,至于其它车型,还要以日后的实际车型规划为准,目前无法确定。
  总结:
   还记得小鹏汽车P7语音系统的上一次重大OTA是加入了全场景语音功能,可见即可说,中控屏上的元素你都可以通过语音控制,而且不用记住那些死板的指令语,看见什么念什么就行。
   “全场景语音”堪称做到了汽车语音助手中一流的功能实现水平,它进一步完善了语音助手的功能丰富度;而此次更加拟人化、有情绪、有情感的小P则是从人机情感交流的角度大大提升了用户体验。“全场景语音”+“拟人化语音输出”,小P又长大了,希望7月下旬的实车体验能给我们带来惊喜。
- 兰博基尼
- 兰博基尼(Automobili Lamborghini S.p.A.)是一家意大利汽车生产商,全球顶级跑车制造商及欧洲奢侈品标志之一,公司坐落于意大利圣亚加塔·波隆尼(Sant'Agata Bolognese),由费鲁吉欧·兰博基尼在1963年创立。主要车型有Aventador、Huracan、雷文顿Reventon、盖拉多Gallardo、蝙蝠Murcielago等。
- 劳斯莱斯
- 劳斯莱斯(Rolls-Royce)是世界顶级的超豪华轿车厂商,1906年成立于英国,公司创始人为Frederick Henry Royce(亨利·莱斯)和Charles Stewart Rolls(查理·劳斯)
- 宾利
- 宾利(BentleyMotors Limited)是一家举世闻名的超豪华汽车制造商,总部位于英国克鲁。1919年,W.O.宾利先生创办了宾利汽车公司
- 宝马
- 宝马(BMW)是享誉世界的豪华汽车品牌。宝马的车系有1系、2系、3系、4系、5系、6系、7系、i系、X1、X2、X3、X4、X5、X6、X7、Z4等几个系列,还有在各系基础上进行改进的M系(宝马官方的高性能改装部门)。宝马公司创建于1916年,总部设在德国慕尼黑。BMW的蓝白标志宝马总部所在地巴伐利亚州州旗的颜色
- 法拉利
- 法拉利是举世闻名的赛车和运动跑车的生产厂家,总部位于意大利马拉内罗(Maranello),由恩佐·法拉利(Enzo Ferrari)于1947年创办,主要制造一级方程式赛车、赛车及高性能跑车。法拉利品牌法拉利所使用的传奇标志有着非同寻常的起源
- 特斯拉
- 特斯拉(Tesla),是一家美国电动车及能源公司,产销电动车、太阳能板、及储能设备。 总部位于美国加利福尼亚州硅谷帕洛阿尔托(Palo Alto)。 特斯拉第一款汽车产品Roadster发布于2008年,为一款两门运动型跑车
- 奔驰
- 梅赛德斯-奔驰奔驰,德国百年汽车品牌,汽车文明的先驱者与引领者,被认为是最成功的高档汽车品牌之一,其登峰造极的技术水平、精湛过硬的质量标准、推陈出新的创新能力、以及一系列经典轿跑车款式令人称道,车系有A级、B级、C级、CL级、CLK级、E级、S级、SL级、SLC级、SLK级、SLR级、G级、GL级、GLK级、M级、R级、AMG车系等。
- 保时捷
- 保时捷(Porsche)是一家德国汽车生产商,又叫波尔舍,总部位于德国斯图加特,是欧美汽车的主要代表。主要车型有911、Boxster、Cayman、Panamera、Cayenne、Macan。1931年,保时捷成立于斯图加特,以生产高级跑车闻名于世界车坛