5G對音頻的賦能到底是怎么發(fā)生的

發(fā)布時間：2021-02-05 16:24:05 點(diǎn)擊次數(shù)：397

5G在這里，您期待什么應(yīng)用程序？”

如果您將這個問題問給大多數(shù)手機(jī)用戶，我相信答案將是高清直播，VR，云游戲等。幾乎沒有人會說：“5g來了，這會讓我聽更多音樂”愉悅”。

實(shí)質(zhì)上，5G增加了帶寬并縮減了延遲，基本上說明了網(wǎng)絡(luò)支持更好的圖像質(zhì)量的能力，因此無論視頻，游戲，AR，vr，5g都與視覺緊密相關(guān)。

那么5G網(wǎng)絡(luò)的升級真的與聽力無關(guān)嗎？換句話說，在當(dāng)今的智能手機(jī)和個人硬件中，有關(guān)“監(jiān)聽”的部分是不是已終止？

實(shí)際上不一定。盡管5g與視覺緊密相關(guān)，但它帶來的聲音并不是少數(shù)。今天我們從多個方向展開演示，如何實(shí)現(xiàn)5g的音頻授權(quán)？

高音色和低延遲：5g特性下的聲音

可以變動聲音的第一件事依然是5G的基本特性：大帶寬和低延遲。

沿著這兩個方向，我們會發(fā)現(xiàn)現(xiàn)有的聲音傳輸仍有很大的優(yōu)化空間。在4G網(wǎng)絡(luò)環(huán)境中，我們習(xí)慣于隨時在線收聽音樂和音頻節(jié)目，甚至觀看現(xiàn)場直播，但是它基本上是基于聲音質(zhì)量大幅度壓縮的根基上，當(dāng)網(wǎng)絡(luò)傳輸速率達(dá)到10gbps左右時，高清聲音質(zhì)量也可以通過網(wǎng)絡(luò)迅速傳輸，以保證實(shí)時共享。5G網(wǎng)絡(luò)的低延遲功能還為聲音帶來了新的可能，例如，可以更適當(dāng)?shù)鼗舛鄠€聲源的同步問題。

將這些5g功能放入應(yīng)用場景中，我們可以很容易地見到5G+sound的功能將在三個方面開放，隨后可能會開挖出一些新的游戲玩法。

1.在線高清，高品質(zhì)音樂。

我們明白在手機(jī)領(lǐng)域很難重現(xiàn)一些高質(zhì)量的音樂。一方面是由于揚(yáng)聲器環(huán)境的限制，另一方面是由于網(wǎng)絡(luò)環(huán)境的限制，使得難以傳輸高質(zhì)量的音頻文件。ASMR直接帶來的變化是很大的高質(zhì)量的音樂和音頻程序更容易實(shí)現(xiàn)。此功能可能會敞開的應(yīng)用程序不僅針對音樂。許多對音色細(xì)節(jié)要求很高的音頻內(nèi)容（例如環(huán)境聲音，催眠音效，白噪音等）可以也可以獲得更好的輸出效果，例如5G使用聲音來觸發(fā)大腦的舒適度，始終強(qiáng)調(diào)其圈子中特別無線電設(shè)備的程度，高級無線電還需要大帶寬的幫助網(wǎng)絡(luò)總算讓用戶體驗(yàn)到了效果。5g的到來可能是類似領(lǐng)域的機(jī)遇。

二，讓聲音在5g中互動。

5g的另一個特性是低延遲，這意味著來自不同來源的聲音可以更好地形成一個總體，這一點(diǎn)適用于在線音頻，可以化解多個終端的同步播送合奏的影響。當(dāng)今的現(xiàn)場直播行業(yè)不時從事一些二重奏和和聲等游戲性，但其質(zhì)量很難與現(xiàn)場音樂并稱。特別是對于樂器合奏而言，在4g網(wǎng)絡(luò)環(huán)境中幾乎不可能達(dá)到不錯的效果。

5g網(wǎng)絡(luò)的特性可以實(shí)現(xiàn)遠(yuǎn)程音樂排練。對商貿(mào)形式的直接影響是5g網(wǎng)絡(luò)可以使來自不同地區(qū)的歌星和音樂家完成高質(zhì)量的合奏演奏。換句話說，在線音樂會是可能的。在當(dāng)今直播和音頻節(jié)目風(fēng)行的環(huán)境中，類似的游戲玩法應(yīng)當(dāng)具有更好的性能。

3.更好的聲音和圖表同步效果。

音頻當(dāng)然不僅限于自身，更時常需要與視頻合作.5g網(wǎng)絡(luò)具有低延遲特性，一種可能在于能夠在vr，游戲和其他環(huán)境中升級音頻和圖表同步體驗(yàn)，因此聲音可以更好地匹配視覺。這種體驗(yàn)的直接商貿(mào)想象力在于交互式視頻。更繁雜和交互式的聲音效果是升級交互式視頻體驗(yàn)的基本途徑之一。

聲音漂移：IoT環(huán)境中無處不在的聲音

一般而言，5g不能被視為一條單獨(dú)的技術(shù)道路，而必須與更多技術(shù)突破相結(jié)合才能提供網(wǎng)絡(luò)幫助。對于語音，也存在這種“5G+”授權(quán)。

例如，我們明白生活場景中的許多IoT設(shè)備傾向于撤除按鈕和觸屏，但是使用智能語音交互作為主要控制項(xiàng)。

這也意味著很多家庭生活和車載場景中的IoT設(shè)備都將攜帶聲音設(shè)備，然后在5g環(huán)境中這些設(shè)備將具有更好的連接性和硬件虛擬化功能，聲音可以在這些設(shè)備之間更好地傳輸設(shè)備。

或許在不久的將來，我們可以期待這樣一個場景：正在客廳里看電視上的電視劇的人們，必須起身鍛煉身體，然后去廚房吃些東西。滿足減肥需要的人，您并不想終止追趕戲劇，最少您必須聽一聽聲音。然后，您可以將電視聲音投放到運(yùn)動耳機(jī)上，然后再將耳機(jī)聲音投入運(yùn)動后放在廚房的揚(yáng)聲器上，或者只是將其扔到冰箱或燃?xì)庠钌?..

IoT系統(tǒng)下的無縫聲音體驗(yàn)不僅意味著用戶可以指引聲音四處走動，而且還意味著設(shè)備能夠識別，明白并與用戶的語音展開交互。每個設(shè)備和用戶都說了些什么，他們所學(xué)的學(xué)問需要系統(tǒng)地共享和再次求學(xué)，所有這些都需要成立在有力的網(wǎng)絡(luò)環(huán)境中。5g和wifi6當(dāng)前是此功能的基礎(chǔ)。

IoT必須具有更多的能力，而聲音就是其中之一。

算法是合理的：AI+5G助能音頻

或許追隨AI領(lǐng)域的朋友有這樣一種感覺，即新聞中的AI語音功能變得愈發(fā)神奇。聲音克隆，情感識別和機(jī)器對話都十分強(qiáng)勁。但是當(dāng)我跌入在手機(jī)和揚(yáng)聲器上時，我總是覺得自己很傻嗎？

這里存在一個基本問題，即計(jì)算能力和網(wǎng)絡(luò)環(huán)境達(dá)不到基準(zhǔn)，在現(xiàn)有條件下無法在終端設(shè)備上運(yùn)轉(zhuǎn)極大的深度學(xué)習(xí)模型，盡管類似的問題在機(jī)器視覺領(lǐng)域出現(xiàn)的更多隨著近兩年語音模型的飛速發(fā)展，計(jì)算能力和網(wǎng)絡(luò)能力欠缺，優(yōu)異算法無法落入用戶終端的問題也開始出現(xiàn)在語音領(lǐng)域。

因此5g加強(qiáng)了音頻功能，另一個想象力在于與AI結(jié)合使用。

將來，我們聽見的機(jī)器聲音和其他人傳送的音頻可能已被大量算法“美化”。聲音全世界中更具欺騙性的“喬碧蘿殿下”指日可待。

相對需要5g網(wǎng)絡(luò)加持語音算法的應(yīng)用程序，包括機(jī)器聲音的實(shí)時美化和情感修改，語音克隆，多模式語義理解等;另一方面，在5g網(wǎng)絡(luò)下，AI也將能夠更好地知曉用戶的聲音，并由此產(chǎn)生更多的游戲性和商貿(mào)價(jià)值。

5G快要來臨，升級網(wǎng)絡(luò)環(huán)境和許多新的網(wǎng)絡(luò)功能將給各個行業(yè)帶來不同的升級效果。對于內(nèi)容創(chuàng)著者而言，5g是新的制圖版，無論您的創(chuàng)意工具是聲音，視頻，游戲還是其他形式在您的想象中，5g是一個新的機(jī)遇。