## ##

        雙十一將至,智能音箱的戰爭已經拉開帷幕

        2018-11-07 17:22:17 閱讀 240289 本文來源:微信公眾號:雷鋒網
        分享至:

        距離雙十一還有4天,各大智能音箱廠商放血補貼大戰已經開始。  

        回想去年,天貓精靈X1 從 499 元狠降到 99 元,雙十一早上8 點銷量就超過了 100 萬臺;為了迎擊天貓精靈,叮咚TOP 智能音箱更是降價到了 49 元。兩大電商巨頭的價格戰極大地促進了智能音箱的銷量,但是由于智能音箱核心的對話式人工智能技術尚未完善,靠價格補貼燃起來的一把火,也沒能越燒越旺。

        20181107164211824.jpg

        語音交互無疑是下一代人機交互模式,智能音箱是目前最被看好的載體之一,即使這個產品離掙錢還遠,也阻擋不了各大巨頭繼續燒錢。在前幾天的百度世界大會上,百度宣布了一系列智能音箱的降價促銷,百度首款帶屏智能音箱小度在家從699元將至299元;全新的小度智能音箱Pro售價399元,雙十一期間價格為 169元 ;小度智能音箱從249元降至69元。了解到,天貓精靈方糖價格直降,2件套/3件套僅89元。

        20181107164213740.jpg

        各大巨頭在價格上依然是貼身肉搏,但是今年,智能音箱的對話式人工智能技術之間的較量,已然拉開了距離。

        百度世界大會上,DuerOS展示了“Endless Conversation”,這是全新的對話式人工智能技術。從字面上來看是“無止盡的對話”的意思,也就是說你只需要一次喚醒,就可以跟智能音箱進行持續的聊天。

        百度的“Endless Conversation”也正是微軟在今年4月發布的“全雙工語音交互技術”,以及谷歌在5月展示的“Duplex”。微軟小冰團隊將 “全雙工語音交互技術”視為有史以來對話式人工智能最重要的更新,谷歌的Duplex也在朋友圈大火了一把,足以印證這一項技術的突破性。

        作為最先實現這項技術的公司,微軟、谷歌、百度自然引領著對話式人工智能全新的技術標準,也讓今年的智能音箱大戰,有了不同的拼殺點。

        我們來詳細聊一聊。


        要雙工

        從蘋果發布Siri以來,不少人都熟悉了語音助手和背后的對話式人工智能技術。語音交互被視為下一代的交互方式,然而在很長一段時間里,跟機器進行語音對話都是一個痛苦的過程。每次對話之前,都需要說喚醒詞,喚醒之后智能進行一次一問一答的交互,說話時還得學著機器字正腔圓的發音,這樣的對話過程既機械又費勁,其結果還時常答非所問,令人沮喪。

        4月4日,微軟小冰發布“全雙工語音交互感官”,從底層技術架構全面刷新了對話體驗,使得微軟小冰能實現一次喚醒連續對話二十分鐘以上,不再依靠搜索而是用深度學習技術自己生成回復內容,答非所問的情況減少。

        20181107164632524.jpg

        微軟對“全雙工語音交互”的解釋為:與既有的單輪或多輪連續語音識別不同,這項新技術可實時預測人類即將說出的內容,實時生成回應并控制對話節奏,能理解對話場景在訴說者/傾聽者之間實現角色轉變,還可以識別說話人的性別、有幾個人在說話。

        半雙工的智能音箱是什么樣子呢?當智能音箱在說話時,它無法聆聽用戶的指令,你無法打斷其說話,只能聽完,而全雙工能實現一直聽加一直說,聽和說都是一直持續動態進行的。

        這樣的技術革新是不可逆的,當你跟微軟小冰進行過一次持續的對話,有了這種近似于與人面對面聊天的體驗后,你就很難再回到不停說喚醒詞一問一答的機器對話狀態。

        微軟這項技術卻被擅長“表現”的谷歌搶先占據了熱點。

        與微軟的“全雙工語音交互技術”命名相同,谷歌稱這項連續對話技術為“Duplex”(雙工)。5月8日,谷歌在Google I/O 2018上介紹了Google Assistant中新增加的Duplex,它可以自己給飯館、發廊等商業店面打電話,幫用戶預約服務,由于Duplex能連續對話,理解上下文后做出很好的回應,店員甚至沒有意識到打電話來的居然是個【AI】。

        這一簡單直接的“AI打電話”秀吸引了不少人的目光,谷歌Duplex一時間刷爆了科技界朋友圈。

        當時,微軟還連夜發布了技術聲明稱:“自2016年8月起,微軟(亞洲)互聯網工程院通過人類用戶主動發起的方式,已讓小冰與人類用戶累計完成了超過60萬通電話。”也就是說,小冰才是第一個能跟人類進行電話聊天的機器人。

        只不過,微軟小冰有其獨特的聲線,而谷歌則是將其Duplex訓練出與真人一模一樣的聲音,讓人無法區分,自然一下子覺得很厲害。不過目前谷歌只是在特定的領域實現了這個技術,例如預定餐廳、發廊等,并不是全開放式的聊天。

        7月4日,百度在“Baidu Create 2018”百度AI開發者大會上也展示了一段百度AI語音助手“小度”給用戶打電話的音頻。

        20181107164212057.jpg

        開發者大會召開之前,百度選擇了一部分參會者,讓小度撥通了他們的電話。小度首先跟開發者確認是否出席大會,隨后為開發者提供餐飲和交通方面的信息。在交流過程中,小度能恰當使用語氣詞;在說話時被用戶打斷也能立刻給出新的回應,不用等到小度將一句話說完;在完成通知用戶參會的任務后,小度也能與用戶展開閑聊,并且主動結束對話。

        由此,能夠實現“全雙工”對話成為對話式人工智能的全新標準,而衡量的最簡單的形式是:AI能夠與人類在電話里流暢對話。


        要能主動提供內容

        做對話式人工智能,對話當然是最為重要的,然而,不少朋友也表示,估計只有小孩子才會喜歡跟智能音箱聊天。

        智能音箱作為家庭的智能中樞,除了要會聊天,要能提供更多個性化的內容變得更加重要。

        為了成為更好的內容提供者,微軟小冰已經走上了才藝雙馨的道路。

        7月26日,微軟小冰升級到第六代,她有了全新的3D形象,還展示了唱歌、作詞作曲、寫作、講故事等才藝。

        在微軟2018人工智能大會上,微軟(亞洲)互聯網工程研究院副院長李笛曾經分享到,現在多數用戶跟語音助手交互的時間其實不超過5秒,一般就是讓語音助手去執行一項命令,這樣的語音助手其實只是像語音化了的遙控器。但是,小冰的團隊希望語音助手能做更多的事,比如走到比較后端,去提供內容。

        大家可以再來感受一遍小冰作詞和演唱的《我知我新》,反正小編是自認唱不過了。

        前幾天,國內創業公司Rokid也在網易云音樂發布了其對話式人工智能演唱的歌曲《Rokid Monkey》。只不過似乎還在初級階段。

        小冰講故事則是依靠語音合成和NLP技術,讓小冰能夠將故事文本用聲情并茂地講出來。這一技能主要是針對兒童。

        百度DuerOS也升級了其內容能力。首先是小度已經能主動給用戶推薦內容。在百度世界大會現場,李彥宏與“小度在家”進行了一番對話。小度在家問李彥宏小度在家問李彥宏是否需要了解一下今日熱詞“唐嫣羅晉婚后現身”,李彥宏答:“呃,換一個吧。”于是小度在家為他推薦了“袁隆平水稻再創紀錄”,播放了相應的新聞、百科、視頻等內容。

        針對兒童市場,百度在DuerOS上升級了兒童模式2.0,在內容資源和交互體驗上都有針對性的優化。兒童語音喚醒率/識別率第一次超過95%,為兒童用戶篩選專用內容。景鯤介紹到,“我們找來10為行業大咖,構建了小度兒童教育成長聯盟,為兒童群體篩選出分離教育內容。”DuerOS擁有超過80萬的精品兒童讀物,百度百科全量1400萬詞條內容。

        同時,DuerOS推出分齡教育,為不同年齡階段的兒童提供不同的內容資源,例如2歲的兒童關注智力開發、語言啟蒙;5歲的兒童關注習慣養成、社交能力,通過分離教育內容可以解決兒童在各個階段教育內容需求配置問題。


        要有更多技能

        不管是智能音箱還是手機里的智能助理,都在一步步朝著數字生活管家邁進。目前,各家智能音箱都在標榜自己平臺上的技能數。

        零散的技能自然不如底層聊天技術重要,但是當底層聊天技術日益成熟時,技能的多少也許會是不同對話式人工智能的安身立命之核心。

        20181107165524459.jpg

        由于很早就搭建起開放式的對話式人工智能平臺,DuerOS在開發者和技能數量上目前在國內領先。目前,DuerOS合作伙伴超過300+,落地主控設備超過160+,DuerOS技能開發者數量24000+,這些數量在國內都是第一。

        不過,這個數字離亞馬遜的Alexa還有一些距離,作為最早發布智能音箱的公司,在全球范圍內,Alexa已經擁有50,000個技能,與20,000種設備兼容,并與超過3,500個品牌合作。這一數字是Alexa一個新的里程碑,也印證著智能音箱席卷全球之勢。


        總結

        智能音箱是具有高科技AI技術的新產品,但是其自誕生起就貼上了低價的標簽,低至69元的價格必然需要公司拿出不少錢去補貼。互聯網發展到后半程,巨頭公司在AI時代的卡位戰似乎在智能音箱這一品類上演得淋漓盡致。

        近日,市場調研機構 Canalys 新發布了 2018 年第三季度中國智能音箱市場報告。數據顯示,第三季度國內智能音箱出貨量達到 580 萬臺,環比增長 1.0%。品牌占有率方面,阿里巴巴、小米依舊占據市場主導地位,分別位列國內市場第一、第二,百度則以強勁的市場表現首次進入市場前三名,京東叮咚則被擠出前三,排名第四。

        微軟雖然在全雙工語音交互技術上有著領先優勢,但是由于其遲遲沒有落地的硬件產品,一直沒有進入智能音箱大戰。今年年初,微軟與小米生態鏈合作企業發布了搭載小愛同學和小冰的雙語音助手音箱Yeelight,不過關注度并不高。

        20181107165936207.png

        2018年,微軟、谷歌、百度都在對話式人工智能技術上獲得了突破,不管是被命名為“全雙工語音交互”、還是“Duplex”還是“Endless Conversation ”,我們都看到了語音交互技術革命性的變化。這自然也為對話式人工智能行業設定了一個標準。

        不過,由于各個公司的基因的不同,在底層技術之外,他們也有著其獨特的個性。比如微軟小冰有著其獨特的活潑調皮、多才多藝的人設;小米小愛同學則能操作小米生態鏈平臺10大類、30多款、共計8500萬智能設備。

        那么今年雙十一,智能音箱排位賽會有怎樣的戰況呢?讓我們拭目以待吧~


        - END -

        責任編輯:wly

        認可我的創作,就鼓勵一下吧

        0人打賞
        分享至:

        聯系客服

        故障反饋