音视频技术开发周刊(第122期)
每周一期,縱覽音視頻技術(shù)領(lǐng)域的干貨和新聞投稿:contribute@livevideostack.com。
架構(gòu)
PSA: WebRTC M79 發(fā)布
更改統(tǒng)計(jì)信息方式并為 mDNS 增加企業(yè)級(jí)策略控制。
IP 攝像頭直播視頻流: RTSP 轉(zhuǎn) WebRTC
Red5 Pro 介紹了他們的 Restreamer 插件。
運(yùn)用機(jī)器學(xué)習(xí)技術(shù)的免費(fèi)嬰兒監(jiān)測(cè)系統(tǒng),且能夠保障數(shù)據(jù)傳輸安全
該方案使用了 WebRTC 技術(shù),能在檢測(cè)到嬰兒哭聲的同時(shí)過濾掉周圍所有其他噪音。
新浪微博:大規(guī)模離線視頻處理系統(tǒng)的架構(gòu)設(shè)計(jì)
微博視頻平臺(tái)在4億月活用戶吃瓜嗨聊的高并發(fā)、大流量背景下,既要保證用戶微博生產(chǎn)和消費(fèi)體驗(yàn),又要支持業(yè)務(wù)快速迭代,確保正確性、穩(wěn)定性和高可用性。本次演將以微博視頻大規(guī)模視頻離線處理系統(tǒng)的架構(gòu)設(shè)計(jì)為主題為大家?guī)泶笠?guī)模分布式系統(tǒng)的架構(gòu)設(shè)計(jì),性能優(yōu)化和高可用保障等一線實(shí)戰(zhàn)經(jīng)驗(yàn)。
傳輸網(wǎng)絡(luò)
基于IP的媒體直播協(xié)議
本文來自VSF.tv 2019年十月的演講,演講者是來自Telecompro.tv的Wes Simpson和來自Q3 Media的Ed Calverley. 本次演講的主要內(nèi)容是關(guān)于現(xiàn)代IP音視頻網(wǎng)絡(luò)的關(guān)鍵技術(shù),ST2110, AES67, PTP和NMOS,以及它們是如何共同作用以實(shí)現(xiàn)全I(xiàn)P直播的。
在通信約束下從樣本中學(xué)習(xí)分布
演講者在本文中介紹了不同的通信協(xié)議,首先是獨(dú)立協(xié)議,也就是每個(gè)節(jié)點(diǎn)單獨(dú)決定如何編碼產(chǎn)生這k比特,所以這些每個(gè)節(jié)點(diǎn)的信息都是獨(dú)立的隨機(jī)變量,這也是獨(dú)立協(xié)議名字的由來。第二種是順序協(xié)議,這種協(xié)議下節(jié)點(diǎn)可以進(jìn)行一定程度上的交互。
各種TCP擁塞控制算法
自從TCP擁塞控制的概念提出以來,TCP擁塞控制算法經(jīng)歷了一系列的演化。這里根據(jù)網(wǎng)上的資料大致總結(jié)一下各個(gè)TCP擁塞控制算法。
編解碼
淺析視頻編解碼技術(shù)的發(fā)展歷程和未來趨勢(shì)
視覺是人類獲取信息的主要途徑,圖像與視頻在人與計(jì)算機(jī)的交互過程中扮演著重要的角色。進(jìn)入21世紀(jì)以后,人們面臨的是一個(gè)高速發(fā)展的信息化社會(huì)。數(shù)字化后的信息,尤其是數(shù)字化后的圖像和視頻信息具有數(shù)據(jù)海量性的特征,給數(shù)據(jù)存儲(chǔ)和傳輸造成了非常大的困難。基于現(xiàn)有的音視頻壓縮技術(shù)的不足,研究和開發(fā)新型有效的多媒體數(shù)據(jù)壓縮編解碼技術(shù),以壓縮的形式存儲(chǔ)和傳輸這些數(shù)據(jù)刻不容緩。
SPRING—用于FASTQ數(shù)據(jù)的下一代壓縮器
本文是來自Stanford Compression Workshop 2019的演講,作者是來自斯坦福大學(xué)的博士畢業(yè)生,Shubham Chandak,他致力于基因組數(shù)據(jù)壓縮和DNA存儲(chǔ)方面的研究。本次演講主要講述了用于FASTQ數(shù)據(jù)的新一代壓縮器SPRING。
視頻技術(shù)
為您的 Squarespace 網(wǎng)站添加音視頻錄制功能?
我們需要更多這樣的能與網(wǎng)站建設(shè)者進(jìn)行集成的功能。
既讓VR模糊后,Facebook:這次我們讓VR更清晰
近期Facebook Reality Labs再次公布了一項(xiàng)新的VR/AR視頻成像相關(guān)技術(shù):DeepFovea。簡(jiǎn)單來講,這是一個(gè)基于AI的注視點(diǎn)渲染方案,它可以通過較為稀疏的像素,來生成高清且逼真的圖像。
基于 Android 的可視頻控制的小車
由聲網(wǎng) Agora 舉辦的首屆AI in RTC 大賽,已在10 月 24 日?qǐng)A滿落幕。其中,參與創(chuàng)意編程賽道的 100 多支參賽隊(duì)伍在 3 個(gè)多月里揮灑創(chuàng)意與熱情,帶來了許多用心的項(xiàng)目。我們邀請(qǐng)了獲獎(jiǎng)的參賽隊(duì)伍們,逐一分享了他們的開發(fā)實(shí)踐。buggy 團(tuán)隊(duì)基于 Android 手機(jī)、開發(fā)板、傳感組件等,開發(fā)了一個(gè)可通過手機(jī)遠(yuǎn)程控制,支持視頻的小車。
人物專訪
Akamai Martin Hor?i?ka:最新網(wǎng)絡(luò)優(yōu)化技術(shù)及編程語言分析
在LiveVideoStackCon深圳站開場(chǎng)之前,我們邀請(qǐng)到了Akamai公司的研發(fā)經(jīng)理Martin Hor?i?ka來接受我們的采訪,采訪中Martin向我們分享了他早期關(guān)于UNIX相關(guān)的OS、網(wǎng)絡(luò)和開發(fā)的工作以及對(duì)于近幾年編程語言發(fā)展的看法。除此之外Martin還提供了關(guān)于multi-connection和P2P的一些技巧,最后,Martin還談到了Akamai最近的項(xiàng)目在基于UDP的安全傳輸協(xié)議做一些優(yōu)化。
張賢國(guó):視頻壓縮還遠(yuǎn)沒有達(dá)到最優(yōu)
正如張賢國(guó)所說,V265在MSU視頻編碼大賽取得成績(jī)的背后是騰訊內(nèi)部多團(tuán)隊(duì)合作的結(jié)果。在視頻編碼優(yōu)化這條路上還有許多工作要做,團(tuán)隊(duì)合作就變得格外重要。本文是MSU2019視頻編碼大賽系列解讀的第一篇。
唐敏豪:我給MSU評(píng)測(cè)打9分
在唐敏豪看來,MSU視頻編碼大賽是目前業(yè)界規(guī)模最大的編碼器客觀評(píng)比平臺(tái),對(duì)視頻編碼器的開發(fā)者和使用者都有很高的參考價(jià)值,但MSU的評(píng)測(cè)對(duì)于特定的業(yè)務(wù)場(chǎng)景不具有絕對(duì)的參考價(jià)值。
AI智能
NeurlPS 2019 | 曠視研究院推出可學(xué)習(xí)的樹狀濾波器,實(shí)現(xiàn)保留結(jié)構(gòu)信息的特征變換
在圖像語義分割任務(wù)中,學(xué)習(xí)到有足夠判別力度的全局特征十分重要。現(xiàn)有大部分方法要么采用堆疊多層局部卷積層,要么使用非局部的block來獲取遠(yuǎn)距離特征之間的語境。然而,由于這些方法都缺乏對(duì)空間結(jié)構(gòu)信息的有效保留,在增大感受野的同時(shí)忽略了物體結(jié)構(gòu)的具體信息。因此,在本文中,曠視研究院團(tuán)隊(duì)提出了一個(gè)可學(xué)習(xí)的樹狀濾波器,它能夠在建模遠(yuǎn)距離語境關(guān)系時(shí)依然保留細(xì)節(jié)信息。
深度學(xué)習(xí)在圖像處理的應(yīng)用一覽
計(jì)算機(jī)視覺的底層,圖像處理,根本上講是基于一定假設(shè)條件下的信號(hào)重建。這個(gè)重建不是3-D結(jié)構(gòu)重建,是指恢復(fù)信號(hào)的原始信息,比如去噪聲。這本身是一個(gè)逆問題,所以沒有約束或者假設(shè)條件是無解的,比如去噪最常見的假設(shè)就是高斯噪聲。
圖像
快速上手網(wǎng)易云音樂可視化
音頻可視化,顧名思義,就是通過獲取音頻的波形、頻率和其他來自音頻的數(shù)據(jù)轉(zhuǎn)換成圖像,再到屏幕上顯示出來。通過它,我們能夠制作一些炫酷的前端音樂界面。
資源推薦
Flutter實(shí)戰(zhàn)
一個(gè)基于 Flutter 的個(gè)人項(xiàng)目
活動(dòng)推薦
硬派多媒體技術(shù)方案沙龍·2019深圳
從WebRTC、低延遲直播到邊緣計(jì)算,從編解碼Codec到AI加速,從全景視頻到沉浸式音頻,從5G到超高清,從金融、教育、制造等行業(yè)應(yīng)用場(chǎng)景優(yōu)化到QoE用戶體驗(yàn)......硬派多媒體技術(shù)方案沙龍(Impact of Multimedia Technology Solution Meetup)旨在甄選技術(shù)領(lǐng)先、成熟的方案與案例,推動(dòng)技術(shù)傳播,連接多媒體技術(shù)生態(tài)上下游。
Xilinx視頻加速技術(shù)專場(chǎng)
從AI到編碼、轉(zhuǎn)碼,硬件加速方案正在扮演越來越重要的角色。本專題,將展現(xiàn)基于FPGA的硬件加速特性,在視頻、圖片編碼與轉(zhuǎn)碼以及AI計(jì)算方面帶來的收益。
點(diǎn)擊“閱讀原文”可查看更多詳細(xì)信息,請(qǐng)大家科學(xué)上網(wǎng)。
總結(jié)
以上是生活随笔為你收集整理的音视频技术开发周刊(第122期)的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: Zoe Liu:传统算法与深度学习各有所
- 下一篇: LiveVideoStackCon深圳-