## ##

        雙十一將至,智能音箱的戰(zhàn)爭(zhēng)已經(jīng)拉開(kāi)帷幕

        2018-11-07 17:22:17 閱讀 240284 本文來(lái)源:微信公眾號(hào):雷鋒網(wǎng)
        分享至:

        距離雙十一還有4天,各大智能音箱廠商放血補(bǔ)貼大戰(zhàn)已經(jīng)開(kāi)始。  

        回想去年,天貓精靈X1 從 499 元狠降到 99 元,雙十一早上8 點(diǎn)銷(xiāo)量就超過(guò)了 100 萬(wàn)臺(tái);為了迎擊天貓精靈,叮咚TOP 智能音箱更是降價(jià)到了 49 元。兩大電商巨頭的價(jià)格戰(zhàn)極大地促進(jìn)了智能音箱的銷(xiāo)量,但是由于智能音箱核心的對(duì)話式人工智能技術(shù)尚未完善,靠?jī)r(jià)格補(bǔ)貼燃起來(lái)的一把火,也沒(méi)能越燒越旺。

        20181107164211824.jpg

        語(yǔ)音交互無(wú)疑是下一代人機(jī)交互模式,智能音箱是目前最被看好的載體之一,即使這個(gè)產(chǎn)品離掙錢(qián)還遠(yuǎn),也阻擋不了各大巨頭繼續(xù)燒錢(qián)。在前幾天的百度世界大會(huì)上,百度宣布了一系列智能音箱的降價(jià)促銷(xiāo),百度首款帶屏智能音箱小度在家從699元將至299元;全新的小度智能音箱Pro售價(jià)399元,雙十一期間價(jià)格為 169元 ;小度智能音箱從249元降至69元。了解到,天貓精靈方糖價(jià)格直降,2件套/3件套僅89元。

        20181107164213740.jpg

        各大巨頭在價(jià)格上依然是貼身肉搏,但是今年,智能音箱的對(duì)話式人工智能技術(shù)之間的較量,已然拉開(kāi)了距離。

        百度世界大會(huì)上,DuerOS展示了“Endless Conversation”,這是全新的對(duì)話式人工智能技術(shù)。從字面上來(lái)看是“無(wú)止盡的對(duì)話”的意思,也就是說(shuō)你只需要一次喚醒,就可以跟智能音箱進(jìn)行持續(xù)的聊天。

        百度的“Endless Conversation”也正是微軟在今年4月發(fā)布的“全雙工語(yǔ)音交互技術(shù)”,以及谷歌在5月展示的“Duplex”。微軟小冰團(tuán)隊(duì)將 “全雙工語(yǔ)音交互技術(shù)”視為有史以來(lái)對(duì)話式人工智能最重要的更新,谷歌的Duplex也在朋友圈大火了一把,足以印證這一項(xiàng)技術(shù)的突破性。

        作為最先實(shí)現(xiàn)這項(xiàng)技術(shù)的公司,微軟、谷歌、百度自然引領(lǐng)著對(duì)話式人工智能全新的技術(shù)標(biāo)準(zhǔn),也讓今年的智能音箱大戰(zhàn),有了不同的拼殺點(diǎn)。

        我們來(lái)詳細(xì)聊一聊。


        要雙工

        從蘋(píng)果發(fā)布Siri以來(lái),不少人都熟悉了語(yǔ)音助手和背后的對(duì)話式人工智能技術(shù)。語(yǔ)音交互被視為下一代的交互方式,然而在很長(zhǎng)一段時(shí)間里,跟機(jī)器進(jìn)行語(yǔ)音對(duì)話都是一個(gè)痛苦的過(guò)程。每次對(duì)話之前,都需要說(shuō)喚醒詞,喚醒之后智能進(jìn)行一次一問(wèn)一答的交互,說(shuō)話時(shí)還得學(xué)著機(jī)器字正腔圓的發(fā)音,這樣的對(duì)話過(guò)程既機(jī)械又費(fèi)勁,其結(jié)果還時(shí)常答非所問(wèn),令人沮喪。

        4月4日,微軟小冰發(fā)布“全雙工語(yǔ)音交互感官”,從底層技術(shù)架構(gòu)全面刷新了對(duì)話體驗(yàn),使得微軟小冰能實(shí)現(xiàn)一次喚醒連續(xù)對(duì)話二十分鐘以上,不再依靠搜索而是用深度學(xué)習(xí)技術(shù)自己生成回復(fù)內(nèi)容,答非所問(wèn)的情況減少。

        20181107164632524.jpg

        微軟對(duì)“全雙工語(yǔ)音交互”的解釋為:與既有的單輪或多輪連續(xù)語(yǔ)音識(shí)別不同,這項(xiàng)新技術(shù)可實(shí)時(shí)預(yù)測(cè)人類(lèi)即將說(shuō)出的內(nèi)容,實(shí)時(shí)生成回應(yīng)并控制對(duì)話節(jié)奏,能理解對(duì)話場(chǎng)景在訴說(shuō)者/傾聽(tīng)者之間實(shí)現(xiàn)角色轉(zhuǎn)變,還可以識(shí)別說(shuō)話人的性別、有幾個(gè)人在說(shuō)話。

        半雙工的智能音箱是什么樣子呢?當(dāng)智能音箱在說(shuō)話時(shí),它無(wú)法聆聽(tīng)用戶的指令,你無(wú)法打斷其說(shuō)話,只能聽(tīng)完,而全雙工能實(shí)現(xiàn)一直聽(tīng)加一直說(shuō),聽(tīng)和說(shuō)都是一直持續(xù)動(dòng)態(tài)進(jìn)行的。

        這樣的技術(shù)革新是不可逆的,當(dāng)你跟微軟小冰進(jìn)行過(guò)一次持續(xù)的對(duì)話,有了這種近似于與人面對(duì)面聊天的體驗(yàn)后,你就很難再回到不停說(shuō)喚醒詞一問(wèn)一答的機(jī)器對(duì)話狀態(tài)。

        微軟這項(xiàng)技術(shù)卻被擅長(zhǎng)“表現(xiàn)”的谷歌搶先占據(jù)了熱點(diǎn)。

        與微軟的“全雙工語(yǔ)音交互技術(shù)”命名相同,谷歌稱這項(xiàng)連續(xù)對(duì)話技術(shù)為“Duplex”(雙工)。5月8日,谷歌在Google I/O 2018上介紹了Google Assistant中新增加的Duplex,它可以自己給飯館、發(fā)廊等商業(yè)店面打電話,幫用戶預(yù)約服務(wù),由于Duplex能連續(xù)對(duì)話,理解上下文后做出很好的回應(yīng),店員甚至沒(méi)有意識(shí)到打電話來(lái)的居然是個(gè)【AI】。

        這一簡(jiǎn)單直接的“AI打電話”秀吸引了不少人的目光,谷歌Duplex一時(shí)間刷爆了科技界朋友圈。

        當(dāng)時(shí),微軟還連夜發(fā)布了技術(shù)聲明稱:“自2016年8月起,微軟(亞洲)互聯(lián)網(wǎng)工程院通過(guò)人類(lèi)用戶主動(dòng)發(fā)起的方式,已讓小冰與人類(lèi)用戶累計(jì)完成了超過(guò)60萬(wàn)通電話。”也就是說(shuō),小冰才是第一個(gè)能跟人類(lèi)進(jìn)行電話聊天的機(jī)器人。

        只不過(guò),微軟小冰有其獨(dú)特的聲線,而谷歌則是將其Duplex訓(xùn)練出與真人一模一樣的聲音,讓人無(wú)法區(qū)分,自然一下子覺(jué)得很厲害。不過(guò)目前谷歌只是在特定的領(lǐng)域?qū)崿F(xiàn)了這個(gè)技術(shù),例如預(yù)定餐廳、發(fā)廊等,并不是全開(kāi)放式的聊天。

        7月4日,百度在“Baidu Create 2018”百度AI開(kāi)發(fā)者大會(huì)上也展示了一段百度AI語(yǔ)音助手“小度”給用戶打電話的音頻。

        20181107164212057.jpg

        開(kāi)發(fā)者大會(huì)召開(kāi)之前,百度選擇了一部分參會(huì)者,讓小度撥通了他們的電話。小度首先跟開(kāi)發(fā)者確認(rèn)是否出席大會(huì),隨后為開(kāi)發(fā)者提供餐飲和交通方面的信息。在交流過(guò)程中,小度能恰當(dāng)使用語(yǔ)氣詞;在說(shuō)話時(shí)被用戶打斷也能立刻給出新的回應(yīng),不用等到小度將一句話說(shuō)完;在完成通知用戶參會(huì)的任務(wù)后,小度也能與用戶展開(kāi)閑聊,并且主動(dòng)結(jié)束對(duì)話。

        由此,能夠?qū)崿F(xiàn)“全雙工”對(duì)話成為對(duì)話式人工智能的全新標(biāo)準(zhǔn),而衡量的最簡(jiǎn)單的形式是:AI能夠與人類(lèi)在電話里流暢對(duì)話。


        要能主動(dòng)提供內(nèi)容

        做對(duì)話式人工智能,對(duì)話當(dāng)然是最為重要的,然而,不少朋友也表示,估計(jì)只有小孩子才會(huì)喜歡跟智能音箱聊天。

        智能音箱作為家庭的智能中樞,除了要會(huì)聊天,要能提供更多個(gè)性化的內(nèi)容變得更加重要。

        為了成為更好的內(nèi)容提供者,微軟小冰已經(jīng)走上了才藝雙馨的道路。

        7月26日,微軟小冰升級(jí)到第六代,她有了全新的3D形象,還展示了唱歌、作詞作曲、寫(xiě)作、講故事等才藝。

        在微軟2018人工智能大會(huì)上,微軟(亞洲)互聯(lián)網(wǎng)工程研究院副院長(zhǎng)李笛曾經(jīng)分享到,現(xiàn)在多數(shù)用戶跟語(yǔ)音助手交互的時(shí)間其實(shí)不超過(guò)5秒,一般就是讓語(yǔ)音助手去執(zhí)行一項(xiàng)命令,這樣的語(yǔ)音助手其實(shí)只是像語(yǔ)音化了的遙控器。但是,小冰的團(tuán)隊(duì)希望語(yǔ)音助手能做更多的事,比如走到比較后端,去提供內(nèi)容。

        大家可以再來(lái)感受一遍小冰作詞和演唱的《我知我新》,反正小編是自認(rèn)唱不過(guò)了。

        前幾天,國(guó)內(nèi)創(chuàng)業(yè)公司Rokid也在網(wǎng)易云音樂(lè)發(fā)布了其對(duì)話式人工智能演唱的歌曲《Rokid Monkey》。只不過(guò)似乎還在初級(jí)階段。

        小冰講故事則是依靠語(yǔ)音合成和NLP技術(shù),讓小冰能夠?qū)⒐适挛谋居寐暻椴⒚刂v出來(lái)。這一技能主要是針對(duì)兒童。

        百度DuerOS也升級(jí)了其內(nèi)容能力。首先是小度已經(jīng)能主動(dòng)給用戶推薦內(nèi)容。在百度世界大會(huì)現(xiàn)場(chǎng),李彥宏與“小度在家”進(jìn)行了一番對(duì)話。小度在家問(wèn)李彥宏小度在家問(wèn)李彥宏是否需要了解一下今日熱詞“唐嫣羅晉婚后現(xiàn)身”,李彥宏答:“呃,換一個(gè)吧。”于是小度在家為他推薦了“袁隆平水稻再創(chuàng)紀(jì)錄”,播放了相應(yīng)的新聞、百科、視頻等內(nèi)容。

        針對(duì)兒童市場(chǎng),百度在DuerOS上升級(jí)了兒童模式2.0,在內(nèi)容資源和交互體驗(yàn)上都有針對(duì)性的優(yōu)化。兒童語(yǔ)音喚醒率/識(shí)別率第一次超過(guò)95%,為兒童用戶篩選專用內(nèi)容。景鯤介紹到,“我們找來(lái)10為行業(yè)大咖,構(gòu)建了小度兒童教育成長(zhǎng)聯(lián)盟,為兒童群體篩選出分離教育內(nèi)容。”DuerOS擁有超過(guò)80萬(wàn)的精品兒童讀物,百度百科全量1400萬(wàn)詞條內(nèi)容。

        同時(shí),DuerOS推出分齡教育,為不同年齡階段的兒童提供不同的內(nèi)容資源,例如2歲的兒童關(guān)注智力開(kāi)發(fā)、語(yǔ)言啟蒙;5歲的兒童關(guān)注習(xí)慣養(yǎng)成、社交能力,通過(guò)分離教育內(nèi)容可以解決兒童在各個(gè)階段教育內(nèi)容需求配置問(wèn)題。


        要有更多技能

        不管是智能音箱還是手機(jī)里的智能助理,都在一步步朝著數(shù)字生活管家邁進(jìn)。目前,各家智能音箱都在標(biāo)榜自己平臺(tái)上的技能數(shù)。

        零散的技能自然不如底層聊天技術(shù)重要,但是當(dāng)?shù)讓恿奶旒夹g(shù)日益成熟時(shí),技能的多少也許會(huì)是不同對(duì)話式人工智能的安身立命之核心。

        20181107165524459.jpg

        由于很早就搭建起開(kāi)放式的對(duì)話式人工智能平臺(tái),DuerOS在開(kāi)發(fā)者和技能數(shù)量上目前在國(guó)內(nèi)領(lǐng)先。目前,DuerOS合作伙伴超過(guò)300+,落地主控設(shè)備超過(guò)160+,DuerOS技能開(kāi)發(fā)者數(shù)量24000+,這些數(shù)量在國(guó)內(nèi)都是第一。

        不過(guò),這個(gè)數(shù)字離亞馬遜的Alexa還有一些距離,作為最早發(fā)布智能音箱的公司,在全球范圍內(nèi),Alexa已經(jīng)擁有50,000個(gè)技能,與20,000種設(shè)備兼容,并與超過(guò)3,500個(gè)品牌合作。這一數(shù)字是Alexa一個(gè)新的里程碑,也印證著智能音箱席卷全球之勢(shì)。


        總結(jié)

        智能音箱是具有高科技AI技術(shù)的新產(chǎn)品,但是其自誕生起就貼上了低價(jià)的標(biāo)簽,低至69元的價(jià)格必然需要公司拿出不少錢(qián)去補(bǔ)貼。互聯(lián)網(wǎng)發(fā)展到后半程,巨頭公司在AI時(shí)代的卡位戰(zhàn)似乎在智能音箱這一品類(lèi)上演得淋漓盡致。

        近日,市場(chǎng)調(diào)研機(jī)構(gòu) Canalys 新發(fā)布了 2018 年第三季度中國(guó)智能音箱市場(chǎng)報(bào)告。數(shù)據(jù)顯示,第三季度國(guó)內(nèi)智能音箱出貨量達(dá)到 580 萬(wàn)臺(tái),環(huán)比增長(zhǎng) 1.0%。品牌占有率方面,阿里巴巴、小米依舊占據(jù)市場(chǎng)主導(dǎo)地位,分別位列國(guó)內(nèi)市場(chǎng)第一、第二,百度則以強(qiáng)勁的市場(chǎng)表現(xiàn)首次進(jìn)入市場(chǎng)前三名,京東叮咚則被擠出前三,排名第四。

        微軟雖然在全雙工語(yǔ)音交互技術(shù)上有著領(lǐng)先優(yōu)勢(shì),但是由于其遲遲沒(méi)有落地的硬件產(chǎn)品,一直沒(méi)有進(jìn)入智能音箱大戰(zhàn)。今年年初,微軟與小米生態(tài)鏈合作企業(yè)發(fā)布了搭載小愛(ài)同學(xué)和小冰的雙語(yǔ)音助手音箱Yeelight,不過(guò)關(guān)注度并不高。

        20181107165936207.png

        2018年,微軟、谷歌、百度都在對(duì)話式人工智能技術(shù)上獲得了突破,不管是被命名為“全雙工語(yǔ)音交互”、還是“Duplex”還是“Endless Conversation ”,我們都看到了語(yǔ)音交互技術(shù)革命性的變化。這自然也為對(duì)話式人工智能行業(yè)設(shè)定了一個(gè)標(biāo)準(zhǔn)。

        不過(guò),由于各個(gè)公司的基因的不同,在底層技術(shù)之外,他們也有著其獨(dú)特的個(gè)性。比如微軟小冰有著其獨(dú)特的活潑調(diào)皮、多才多藝的人設(shè);小米小愛(ài)同學(xué)則能操作小米生態(tài)鏈平臺(tái)10大類(lèi)、30多款、共計(jì)8500萬(wàn)智能設(shè)備。

        那么今年雙十一,智能音箱排位賽會(huì)有怎樣的戰(zhàn)況呢?讓我們拭目以待吧~


        - END -

        責(zé)任編輯:wly

        認(rèn)可我的創(chuàng)作,就鼓勵(lì)一下吧

        0人打賞
        分享至:

        聯(lián)系客服

        故障反饋