2017年度音頻行業觀察
Soomal 于 2018.02.09 18:19:14 | 源自:www.soomal.com | 版權:原創
平均/總評分:10.00/210

2018年2月中國新年戊戌年將至,Soomal發布年度綜述的時間也就到了。今天我們以音頻行業綜述開頭,之后會有手機、相機三篇年度綜述。最后有2017年度產品推薦與不推薦榜單。在春節放假的日子里,我們會停止更新內容,但準備了抽獎活動,感謝一年來網友們對Soomal的支援。

喇叭的人工智能化

去年的綜述,我們以“智能喇叭”做結尾,不算豐富的產品和并不算好的語意識別能力并沒有帶來理想的用戶體驗。

在2017年,國外與國內,上游和終端對于智能喇叭的熱情被點燃了。以亞馬遜Echo為代表的智能喇叭[2014年發布]延續了2016年下半年的迅猛增長勢頭,在美國市場以亞馬遜Echo系列,Google Home喇叭銷量和用戶滲透率都有飛速增長。

Echo系列截止2017年前三季度累計銷量突破2000萬臺,而2016年底發布的Google Home隨著價格優惠銷量也達到700萬臺。美國2017年智能喇叭家庭滲透率達到16%,比前一年增長1.2倍以上。機構普遍預測,到2020,智能喇叭在美國家庭滲透率將達到75%以上,市場容量達到8000萬臺左右。全球市場來看,2018年智能喇叭的出貨量將達到5000萬臺以上,相比2017年再增長60%以上。

目前,Echo系列和Google Home占據了9成以上的智能喇叭市場。而哈曼推出和微軟Cortana引擎合作的Invoke喇叭,CES2018前LG推出的ThinQ喇叭,Lenovo同步國際市場推出的智能喇叭等說明各家正以不同的方式加入到智能喇叭行列中。

對于明顯不同的中文語音,就更有意思了。回到中國市場,在2017年越來越多的企業加入到了智能喇叭的行列。小米推出“小愛”小米AI喇叭;阿里發布“天貓精靈X1”智能喇叭;聯想發布智能喇叭,并與哈曼合作推出特別款;喜馬拉雅推出小雅智能喇叭;京東與科大訊飛合作的“叮咚”更新至2.0,并與索尼合作推出智能喇叭;出門問問推出問問喇叭Tickhome等等。如果說這些喇叭的外觀看起來都有幾分相似的話,而內在的軟硬體方案卻各不相同。

從硬體來看,智能喇叭的語音識別和智能手機不太一樣,大多數產品需要實現3-5米甚至更遠一些的自然語音強度的內容識別,屬于遠場語音識別。一般需要系統支援多通道麥克風[2-8個不等],麥克風降噪和識別背后基礎的支援,它需要從環境噪聲中提取語音輸入有用資訊,同時還要考慮到自己是一臺喇叭,揚聲器在正在工作時的喚醒識別。這在2016年的叮咚上其實做的不夠好,而現在的智能喇叭基本都能做到。這絕對是語言自然性上的很大進步。

喇叭擺位的隨意性,更照顧聲學結構的特殊緊湊的空間設計,都對系統的硬體集成度和穩定性有了不同的要求。高通作為后來者,2017年中發布Smart Audio平臺,技術指標基本可以作為智能喇叭功能需求的樣本。它提供了WiFi[802.11ac、5G、2X2 MIMO]、藍牙[apt-X]、集成支援多通道麥克風降噪識別,4聲道揚聲器輸出[一般容易實現360度輸出喇叭],并且在音頻功能接口、解碼規格方面做了很好的支援。

同期,聯發科Mediatek也發布了MT8516方案,同樣在麥克風、網路、音頻通道輸出等方面為智能喇叭優化,阿里推出的精靈X1號稱使用首個SmartAudio晶片,其實就是MT8516,Amazon的Echo同樣是來自聯發科的方案。Intel在2016年就傳有意推出智能喇叭產品,2017年Lenovo的智能喇叭基于Intel Atom X系列平臺,應該算Intel進軍IoT音頻市場的一個樣板性產品。

當然,早就和叮咚喇叭合作的全志R16平臺,小米AI喇叭使用AMLogic平臺,瑞芯微推出的RK3229平臺,都為智能喇叭的特別的硬體需求做好了準備。同時,也對Alexa、Google Assistant以及國內的阿里、百度、科大訊飛等平臺做好了軟體接口。除了主控晶片之外,揚聲器、麥克風陣列、網路、音頻數字DSP和功放,以及未來輔助熒幕接口和視訊拾取等功能都可能成為智能喇叭設計中不可忽略的環節。[注:關于產品細節,會是我們2018年的重點,不在本文詳細對比了。]

從軟體也就是智能喇叭的“智商”來看,中國用戶顯然還很難給出高分,但對于中文來說語音的識別并不是大問題,背后的知識庫和語義的理解是AI和深度學習要發揮作用的地方。我們看到Amazon、Google、百度、阿里、科大訊飛、思必馳、云知聲、 等在這方面投入都非常大,也看到2016年的Alpha Go和2017年的Alpha Zero在技術推動下的飛速提高。 相信在2020年前,智能喇叭飛速發展的三年時間里,深度學習和AI在自然語言人機交流方面還會有飛速進步。

自然語言識別未來將更多分布到除了喇叭以外IoT[物聯網]裝置中,例如汽車平臺。可以想象,自然語言識別水準的提高以及人臉[廣義人臉生物識別]識別技術的不斷進步,將人與機器的交互變得更像人與人面對面的自然溝通。

轉發到新浪微博 轉發到騰訊微博 RSS訂閱 收藏本文 本文代碼
請您評分 1 2 3 4 5 6 7 8 9 10

此帖使用Win10提交
發表于2018.02.19 22:07:14
74
總結并展望,希望未來有更多的驚喜帶給我們的耳朵。
此帖使用Win10提交
發表于2018.02.19 12:16:33
73
061.129.***.***
061.129.***.***
71
希望線性音效卡這類產品可以多些廠家參與進來,日后可以看到音質可以媲美例如06p這類便攜音效卡的產品出現。
此帖使用NEM-TL00提交
發表于2018.02.15 16:03:15
70
123.116.190.***
123.116.190.***
發表于2018.02.14 19:23:37
69
059.115.158.***
059.115.158.***
發表于2018.02.13 06:16:00
67
112.084.196.***
112.084.196.***
發表于2018.02.12 23:01:47
66
123.151.077.***
123.151.077.***
發表于2018.02.12 16:19:13
65
223.166.144.***
223.166.144.***
發表于2018.02.12 13:01:20
63
121.032.***.***
121.032.***.***
不過辣雞魅族pro5對這線支援不好,而且手機記憶體也快爆炸,這線就被我封存了(反正有09)話說數毛有沒有啥優秀又不貴的轉盤推薦啊,手機給09做轉盤感覺還是不太方便
此帖使用Win10提交
發表于2018.02.11 22:44:41
62
123.173.012.***
123.173.012.***
發表于2018.02.11 21:05:57
61
202.059.214.***
202.059.214.***
發表于2018.02.11 19:43:46
58
114.229.074.***
114.229.074.***
發表于2018.02.11 19:16:38
57
2018年,無線音頻會出現急速增長的勢頭!
發表于2018.02.11 15:06:43
56
218.020.227.***
218.020.227.***
發表于2018.02.11 15:05:19
55
提示本貼可以匿名回復 ,您現在正處在潛水狀態
回復
驗證碼
2713 為防止廣告機貼垃圾,不得已而為之
表情
正文