目前智能汽車(chē)可以分為自動(dòng)駕駛和智能座艙兩大塊,而智能座艙里的一個(gè)比較核心的能力就是只能語(yǔ)音助手,通過(guò)智能語(yǔ)音助手幫助用戶去操控整個(gè)智能座艙,為用戶提供服務(wù)。本文作者對(duì)智能座艙里的智能語(yǔ)音助手進(jìn)行了分析,一起來(lái)看一下吧。
智能汽車(chē)可以分為兩大塊:自動(dòng)駕駛和智能座艙。
自動(dòng)駕駛主要研究的是怎么從A點(diǎn)移動(dòng)到B的點(diǎn);而智能座艙主要研究的是,在移動(dòng)的過(guò)程中,怎么給車(chē)艙內(nèi)的用戶創(chuàng)造更好的生活體驗(yàn)。
現(xiàn)在大家提成出了一個(gè)新的概念:智能座艙是第三生活空間。即繼家庭、工作以外的另一個(gè)生活空間。
目前在智能座艙里比較核心的一個(gè)能力就是智能語(yǔ)音助手,通過(guò)智能語(yǔ)音助手幫助用戶去操控整個(gè)智能座艙,為用戶提供服務(wù)。
本文主要討論的是智能座艙里的智能語(yǔ)音助手。
一、車(chē)載智能語(yǔ)音助手目前都能做些什么?
總的來(lái)說(shuō),車(chē)載語(yǔ)音助手可以給車(chē)機(jī)系統(tǒng)的應(yīng)用程序發(fā)送指令和給車(chē)機(jī)部件發(fā)送指令。可見(jiàn)即可說(shuō),即在中控屏上看到的功能,都可以用語(yǔ)音的方式發(fā)送指令控制。
主要分為兩大塊:
1. 操控娛樂(lè)信息
操控娛樂(lè)信息是指控制中控屏里的娛樂(lè)信息應(yīng)用程序(非汽車(chē)部件),如播放音樂(lè)、查天氣、查股票、播放電影、播放電臺(tái)等。
2.操控車(chē)機(jī)
操控車(chē)機(jī)是指操控汽車(chē)零部件,如操控空調(diào)、車(chē)窗、座椅、氛圍燈等;但通常不會(huì)控制汽車(chē)行駛移動(dòng)相關(guān)的功能,如不控制汽車(chē)行駛的速度、轉(zhuǎn)向等。
小結(jié)
通常座艙內(nèi)會(huì)有多個(gè)麥克風(fēng),能夠識(shí)別到用戶在哪個(gè)位置說(shuō)話。比如坐在副駕駛的用戶說(shuō)“打開(kāi)車(chē)窗”,會(huì)打開(kāi)副駕駛的車(chē)窗,不需要用戶說(shuō)明要打開(kāi)哪個(gè)車(chē)窗。
目前主要是通過(guò)語(yǔ)音呼叫方式來(lái)喚醒語(yǔ)音助手,類(lèi)似于智能音箱的喚醒方式。
未來(lái)應(yīng)該會(huì)朝著多種喚醒方式的方向發(fā)展,如通過(guò)視覺(jué)的方式,看到用戶在調(diào)座椅,助手可以主動(dòng)說(shuō)“可以通過(guò)說(shuō)話方式來(lái)調(diào)整座椅哦”。主動(dòng)地給用戶提供服務(wù),目前更多是被動(dòng)的方式。
有些廠商目前一次喚醒只能發(fā)送一條指令,未來(lái)應(yīng)該會(huì)朝著持續(xù)監(jiān)控用戶意圖的方式發(fā)展。
目前理解用戶意圖基本只會(huì)通過(guò)語(yǔ)音的方式,未來(lái)肯定是朝著多模態(tài)的方向發(fā)展,如通過(guò)語(yǔ)音+視覺(jué)+各種傳感器等多緯度的信息理解用戶的意圖。
二、各車(chē)型智能語(yǔ)音助手功能總結(jié)
筆者通過(guò)線下體驗(yàn)店體驗(yàn)了6款車(chē)型的智能語(yǔ)音助手,記錄了體驗(yàn)的感受。當(dāng)然會(huì)有誤差或不準(zhǔn)確,僅供大家參考。誤差的影響因素可能來(lái)自:環(huán)境網(wǎng)絡(luò)差、用戶操作不當(dāng)、環(huán)境噪音等。
1. 比亞迪-漢
關(guān)鍵字:中規(guī)中矩、無(wú)明顯短板也無(wú)明顯亮點(diǎn)
基礎(chǔ)的控制汽車(chē)部件、控制媒體信息的能力都有;媒體信息的豐富度也很多、響應(yīng)速度和準(zhǔn)確率也不錯(cuò)。
缺點(diǎn):
不支持一次喚醒多次對(duì)話。大多數(shù)場(chǎng)景不支持多輪交互(如先播放周杰倫的音樂(lè),再說(shuō):再播放他的電影,不支持)。閑聊能力幾乎沒(méi)有,如說(shuō):“你好笨啊”、“我生氣了”,助手接不了話。
2. 零跑-C01
關(guān)鍵字:基礎(chǔ)能力都有,但不穩(wěn)定
基礎(chǔ)的控制汽車(chē)部件、控制媒體信息的能力都有;媒體信息的豐富度也很多、響應(yīng)速度和準(zhǔn)確率也很高。支持一次喚醒,在一定時(shí)間內(nèi)可進(jìn)行多次交互。
缺點(diǎn):
說(shuō)打開(kāi)車(chē)窗、換個(gè)氛圍燈等對(duì)汽車(chē)零部件的控制指令,不穩(wěn)定,有時(shí)不執(zhí)行。大多數(shù)場(chǎng)景不支持多輪交互(如先播放周杰倫的音樂(lè),再說(shuō):再播放他的電影,不支持)。閑聊的內(nèi)容幾乎沒(méi)有,如說(shuō):“你好笨啊”、“我生氣了”,助手接不了話。
3. 問(wèn)界-M5車(chē)機(jī)用的是鴻蒙系統(tǒng),手機(jī)跟車(chē)機(jī)系統(tǒng)互聯(lián)互通(不是投屏)、響應(yīng)超快。支持一次喚醒,在一定時(shí)間內(nèi)可進(jìn)行多次交。支持多意圖,如能識(shí)別并執(zhí)行“打開(kāi)車(chē)窗和打開(kāi)”。有多輪交互的能力,如先說(shuō):“把主駕駛座椅調(diào)成按摩”,再說(shuō)“座椅調(diào)前一點(diǎn)”,能理解到說(shuō)的是前排座再調(diào)前一點(diǎn)。支持根據(jù)人臉I(yè)D,記憶用戶偏好,如座椅位置。
缺點(diǎn):
一系列都需要用的是華為的產(chǎn)品、限制比較多、應(yīng)用軟件必須要在鴻蒙系。閑聊的能力幾乎沒(méi)有,如說(shuō):“你好笨啊”、“我生氣了”,助手接不了。
4. 理想-L9
1)語(yǔ)音助手支持語(yǔ)音+視覺(jué)方式結(jié)合去理解用戶的意圖。
比如,“打開(kāi)這個(gè)”,邊說(shuō),邊用手指指著要操作的物體,就能識(shí)別。
暫且不說(shuō)有多方便,起碼算是語(yǔ)音和視覺(jué)一起識(shí)別用戶意圖的一個(gè)開(kāi)始,后續(xù)有很多想象的空。
2)支持一次喚醒,在一定時(shí)間內(nèi)可進(jìn)行多次交。(沒(méi)有找到明顯的缺點(diǎn))
5. 極氪-001
1)有一定的閑聊能力。
2)支持一次喚醒,維持一段時(shí)間的交互。
缺點(diǎn):
一些使用頻次低的功能,意圖的識(shí)別準(zhǔn)確度還是比較低。不支持多輪交互,如“座椅調(diào)前一點(diǎn)”;再說(shuō)“再調(diào)前點(diǎn)”,就每辦法識(shí)別了。
6. 特斯拉-Model3
缺點(diǎn):
需要按住按鈕才能說(shuō)話意圖缺乏泛化能力,基本要完全命中文案才會(huì)執(zhí)行很多命中了也沒(méi)辦法執(zhí)行指令
總的來(lái)說(shuō)【簡(jiǎn)約】,能減的功能都給你減了。
使用體驗(yàn)評(píng)分
根據(jù)個(gè)人的體驗(yàn),做了下評(píng)分,供大家參考。
三、總結(jié)智能車(chē)載語(yǔ)音助手待優(yōu)化問(wèn)題1.喚醒問(wèn)題
很多廠家的語(yǔ)音助手還是只能支持一次喚醒,一次對(duì)話的形式。若用戶需要連續(xù)跟助手對(duì)話時(shí),交互的效率和體驗(yàn)會(huì)大打折扣的。
一次喚醒,一段時(shí)間內(nèi)支持監(jiān)測(cè)用戶多次說(shuō)話,可能會(huì)引發(fā)誤理解的問(wèn)題。用戶在跟其他人說(shuō)話或者在唱歌,可能會(huì)給語(yǔ)音助手誤以為是在給它發(fā)指令,引發(fā)誤操作。
2.低頻使用的功能待完善
雖然很多廠家都標(biāo)榜自己可見(jiàn)即可說(shuō),但實(shí)際上很多低頻操控的功能還不是很完善。比如說(shuō):調(diào)整座椅等,意圖的識(shí)別準(zhǔn)確率偏低,意圖識(shí)別的顆粒度不夠細(xì)。
3.多模態(tài)識(shí)別問(wèn)題
目前理解用戶意圖的方式還是比較單一,大多數(shù)只能通過(guò)語(yǔ)音理解。
但在環(huán)境音比較嘈雜的情況下,理解的準(zhǔn)確率度會(huì)偏低,如打開(kāi)車(chē)窗后噪音比較大、車(chē)內(nèi)多乘客同時(shí)說(shuō)話、媒體音量比較大時(shí),都會(huì)影響助手對(duì)用戶意圖的理解。
在這樣的環(huán)境下,如果讓語(yǔ)音+唇語(yǔ)+手勢(shì)等其他緯度結(jié)合去理解用戶的意圖,可以提升對(duì)用戶意圖理解的準(zhǔn)確率,這也是未來(lái)大家爭(zhēng)相要突破的方向。
4.多輪交互問(wèn)題
大多廠商的語(yǔ)音助手在多輪交互上的能力還是比較欠缺的,甚至沒(méi)有。
比如,先說(shuō)“放一首周杰倫的歌”,然后再說(shuō)“放他的電影吧”,這時(shí)就識(shí)別不了是要放周杰倫的電影了。
需要實(shí)現(xiàn)多輪的對(duì)話能力,還需要涉及怎么維持對(duì)話的狀態(tài)、記錄對(duì)話的槽位信息等等。
用戶實(shí)際的對(duì)話場(chǎng)景是非常復(fù)雜的,如果讓語(yǔ)音助手看起來(lái)跟智能,有更加自然的對(duì)話效果,還是有很長(zhǎng)的路要走的。
5.閑聊、情感陪伴問(wèn)題
大多數(shù)廠商在閑聊(非執(zhí)行任務(wù)或指令)的場(chǎng)景下,能力還是很弱的,甚至是沒(méi)有的。
比如說(shuō):“今天天氣真好”、“今天好開(kāi)心啊”、“又下雨了怎么辦呢”等等,智能助理基本是無(wú)法接話的。
處理執(zhí)行任務(wù)和指令是基礎(chǔ)能力,但閑聊和情感陪伴是個(gè)性化和擬人化的必經(jīng)之路。
比如,智能助理能夠記住跟用戶歷史的聊天記錄。若用戶之前跟助手提過(guò)自己的生日,或者提過(guò)女朋友的生日,下次聊天問(wèn)“你還記得我生日嗎”,助手能回答。
甚至在記住我生日后,在生日那天主動(dòng)跟我說(shuō)生日快樂(lè)。這樣整個(gè)助手就會(huì)更加的有人的溫度。
本文由 @JM 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載。
題圖來(lái)自Unsplash,基于CC0協(xié)議。
結(jié)尾,以上就是car的地址怎么登不上(體驗(yàn)了6款車(chē)載智能語(yǔ)音助手后的總結(jié))的文章整合
版權(quán)聲明:本文來(lái)自互聯(lián)網(wǎng)整理發(fā)布,如有侵權(quán),聯(lián)系刪除
原文鏈接:http://m.avtt22014.comhttp://m.avtt22014.com/tiyuzhishi/4539.html