音视频技术开发周刊 | 157
每周一期,縱覽音視頻技術(shù)領(lǐng)域的干貨和新聞投稿:contribute@livevideostack.com。
內(nèi)容推薦
SRT協(xié)議在電視直播中的應(yīng)用
本文來自安徽廣播電視臺 直播技術(shù)工程師 張博力在LiveVideoStackCon 2020 線上峰會的演講,詳細(xì)介紹了SRT協(xié)議在信號傳輸、遠(yuǎn)程制作等方面的應(yīng)用,以及實際工作中遇到的相關(guān)技術(shù)問題。
https://mp.weixin.qq.com/s/qN54rJ53MetFL-GK7d6ptw
FreeSWITCH視頻會議“標(biāo)準(zhǔn)”解決方案
本文由FreeSWITCH 中文社區(qū)創(chuàng)始人杜金房在LiveVideoStack線上分享的演講內(nèi)容整理而成,詳細(xì)介紹了FreeSWITCH做為一種開源的視頻會議解決方案如何在開源、開放的基礎(chǔ)上,對接各種無法修改的“標(biāo)準(zhǔn)”視頻會議終端、WebRTC瀏覽器以及微信小程序等,迎接各種挑戰(zhàn)。
https://mp.weixin.qq.com/s/LOCxUNBA1j94qJPqY1RKrA
架構(gòu)
Qt5+FFmpeg實現(xiàn)同時采集屏幕+麥克風(fēng)+系統(tǒng)音頻的錄屏軟件
windows下實現(xiàn)錄制屏幕,系統(tǒng)聲音,麥克風(fēng)聲音成mpeg4(Win7及以上系統(tǒng)),并且實現(xiàn)音視頻同步和基礎(chǔ)UI界面。
https://blog.csdn.net/qq_34940879/article/details/107797504?utm_medium=distribute.pc_category.none-task-blog-hot-3.nonecase&depth_1-utm_source=distribute.pc_category.none-task-blog-hot-3.nonecase&request_id=
傳輸網(wǎng)絡(luò)
互聯(lián)網(wǎng)可靠實時協(xié)議RIST和SRT
使用SRT和RIST協(xié)議的場景很豐富,包括攝影機到基站的轉(zhuǎn)播、體育場轉(zhuǎn)播、新聞報道和云轉(zhuǎn)播等。
https://mp.weixin.qq.com/s/Dhz0jsHRiSrN7QZYPbxF_A
RIST –可靠的互聯(lián)網(wǎng)流傳輸
從任何地方上網(wǎng)似乎正越來越成為可能。當(dāng)然,嚴(yán)格意義上講,這并不正確,但將互聯(lián)網(wǎng)連接到某個地方的選擇正在逐年增加。很快,5G將提供更可靠的接入互聯(lián)網(wǎng)的新方式,衛(wèi)星互聯(lián)網(wǎng)的部署正在逐漸增多,ISP基礎(chǔ)設(shè)施繼續(xù)擴大。既然互聯(lián)網(wǎng)觸及了很多廣播公司想要的領(lǐng)域,為什么他們不把它用于視頻和音頻連接,代替專用線路呢?
https://mp.weixin.qq.com/s/mBTYr1MaEs2NffocByEsCg
完整雙流控制協(xié)議 (BFCP),SDP拓展和應(yīng)用概論
本文將重點介紹通過SDP拓展實現(xiàn)的BFCP數(shù)據(jù)交互信息的方式和BFCP其他技術(shù)架構(gòu)的討論,應(yīng)用場景(例如物聯(lián)網(wǎng)IOT)和其他部署問題的討論。
https://mp.weixin.qq.com/s/w-SXoX_fPrzC0i4e_kxpOQ
ATSC3.0:新一代廣播標(biāo)準(zhǔn)
Jerald在文中介紹了ATSC3.0是一個全新的電視廣播標(biāo)準(zhǔn),并簡單回顧了ATSC的發(fā)展歷程和重要性,指出現(xiàn)在的電視廣播協(xié)議中手機成為了主要的終端設(shè)備,并且還需要具有足夠強大的一對多廣播的能力。Jerald接著介紹了ATSC3.0是一個全I(xiàn)P的協(xié)議,并擁有傳輸多種動態(tài)視頻流的能力。
https://mp.weixin.qq.com/s/tOKFDU5Y0xr7qthCAl2dlQ
編解碼
創(chuàng)建商用AV1軟件編碼器的挑戰(zhàn)
本文討論了AV1在視頻和游戲的低帶寬流傳輸中的特定應(yīng)用,針對性能受限的解碼器調(diào)整編碼的重要性以及使用機器學(xué)習(xí)技術(shù)調(diào)整視頻壓縮參數(shù)的重要性。
https://mp.weixin.qq.com/s/E2OcEhzbCotpA13CRkGoGg
中國的大學(xué)可以塑造視頻以及其他領(lǐng)域的未來,如果他們獲得了正確的知識產(chǎn)權(quán)
關(guān)于VVC的專利,中國公司和大學(xué)非常活躍。
https://www.iam-media.com/frandseps/chinese-universities-can-shape-future-of-video-and-plenty-more-besides-if-they-play-ip-right
音視頻技術(shù)
音視頻元數(shù)據(jù)那些事
本文主要介紹音頻AAC、視頻H264和H265等編碼格式的元數(shù)據(jù),以及它們在MediaCodec中的處理邏輯和在封裝容器中的存儲邏輯。
https://juejin.im/post/6858809474820997127
視頻字幕技術(shù)及案例
演講主要介紹了自動語音識別(ASR),以及如何將其應(yīng)用于視頻和音頻內(nèi)容的字幕;描述了當(dāng)今各種字幕方法的利弊;討論美國監(jiān)管字幕環(huán)境,其預(yù)期的未來和處罰;探索監(jiān)管環(huán)境將如何影響內(nèi)容創(chuàng)作者、內(nèi)容發(fā)布者(網(wǎng)站,廣播公司等)、場地設(shè)計師和業(yè)主、系統(tǒng)集成商;概述ASR的一些新優(yōu)點。
https://mp.weixin.qq.com/s/M092snvVUCzSEOEa4S6ndA
人物專訪
“非洲用戶的付費意愿并不低”—— 專訪四達(dá)時代研發(fā)總監(jiān)張亮
2018年世界杯前,StarTimesOn App在非洲正式上線,全程直播32個球隊的64場比賽,獲得了廣泛的關(guān)注和大量用戶。在非洲的網(wǎng)絡(luò)條件下,交付良好的視頻播放體驗絕非易事,所以這幾年張亮的工作就是從各個角度探索問題的解決方案,以保障非洲地區(qū)的視頻播放體驗。
https://mp.weixin.qq.com/s/HWAwb-9cpNzYD1S7Zr0rlw
AI智能
一個眼神都不放過,FRL公布自然表情系統(tǒng)MCA
通常,頭像是一個社交平臺的重要元素之一。而在目前大多數(shù)VR社交應(yīng)用中,大多數(shù)虛擬頭像都比較卡通風(fēng),還達(dá)不到像人那樣真實。因此,為了打造更逼真的VR頭像,社交媒體和科技巨頭Facebook一直在打造一個叫Codec Avatar的系統(tǒng)。
https://mp.weixin.qq.com/s/EaDQwf19WtHOompcMhUmKQ
GitHub Repository,讓計算機視覺開發(fā)更上一層樓
如今,計算機視覺在許多領(lǐng)域都被廣泛應(yīng)用,且進展非凡。但是計算機視覺的準(zhǔn)入門檻對初學(xué)者較高,為了對廣泛的受眾更加友好,微軟將多年在計算機視覺領(lǐng)域工作中對處理現(xiàn)實世界問題的代碼和心得,都放到了一個開源的 GitHub Repository(以下簡稱 GitHub Repo)中供更多人使用。
https://mp.weixin.qq.com/s/WEBLwo_3xio0l1euArZjfQ
圖像
MMEditing:多任務(wù)圖像視頻編輯工具箱
我們近期在 OpenMMLab 項目中開源了MMEditing。這是一個圖像和視頻編輯的工具箱,它目前包含了常見的編輯任務(wù),比如圖像修復(fù),圖像摳圖,超分辨率和生成模型。在編輯圖像或者視頻的時候,我們往往是需要組合使用以上任務(wù)的,因此我們將它們整理到一個統(tǒng)一的框架下,方便大家使用。
https://mp.weixin.qq.com/s/9mdWJ25eBAkXeHdYEbNEEg
資源推薦
抖音直播的禮物特效引擎
為了直播事業(yè)的蓬勃發(fā)展,我們開源了抖音直播的禮物特效引擎,拋磚引玉,歡迎各位交流討論。
https://github.com/bytedance/AlphaPlayer
吳恩達(dá)推薦筆記:22張圖總結(jié)深度學(xué)習(xí)全部知識
195篇NAACL+295篇ACL2019有代碼開源的論文。
https://github.com/yizhen20133868/NLP-Conferences-Code
活動推薦
【8折倒計時】全年唯一一場音視頻線下大會,我們在北京等你來High
線上學(xué)習(xí)、遠(yuǎn)程辦公、在線參會……歷經(jīng)了半年多的時空隔閡,我們決定10月31日-11月1日在北京舉行一場音視頻領(lǐng)域的線下聚會,這里有你認(rèn)識的老朋友,也有許多新鮮面孔,但最重要的是原汁原味的技術(shù)干貨,最新視頻編解碼標(biāo)準(zhǔn)與算法優(yōu)化、如何應(yīng)對復(fù)雜網(wǎng)絡(luò)環(huán)境、AI與多媒體技術(shù)的落地實踐……
吳端培? 思科? 首席架構(gòu)和軟件工程師? 《大規(guī)模分布式實時視頻會議與流媒體:架構(gòu)設(shè)計、問題與解決方案》
孫立峰? 清華大學(xué)? 計算機科學(xué)與技術(shù)系教授 《AI 輔助的互聯(lián)網(wǎng)視頻分發(fā)與傳輸:趨勢、挑戰(zhàn)與實踐》
陳勁松? VIPKID? 音視頻架構(gòu)師 《VIPKID音視頻中臺演進之旅》
徐邁? 北京航空航天大學(xué)? 教授、博士生導(dǎo)師? 《數(shù)據(jù)驅(qū)動下的壓縮視頻增強》
劉建永? 美團? 軟件研發(fā)工程師? 《美團通訊平臺接入RTC應(yīng)用實踐》
點擊【閱讀原文】了解更多講師及話題信息
總結(jié)
以上是生活随笔為你收集整理的音视频技术开发周刊 | 157的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: SRT协议在电视直播中的应用
- 下一篇: LiveVideoStackCon 北京