音视频技术开发周刊 93期
『音視頻技術開發周刊』由LiveVideoStack團隊出品,專注在音視頻技術領域,縱覽相關技術領域的干貨和新聞投稿,每周一期。點擊『閱讀原文』,瀏覽第93期內容,祝您閱讀愉快。
架構
Nodejs+socket.io搭建WebRTC信令服務器
本文介紹了 Nodejs 的工作原理、Nodejs的安裝與布署,以及如何使用 要sokcet.io 構建 WebRTC 信令消息服務器。socket.io 由于有房間的概念所以與WebRTC非常匹配,用它開發WebRTC信令服務器非常方便。
蔡銳濤:CG內容互動與5G的碰撞
在LiveVideoStackCon2019上海音視頻技術大會前夕,LiveVideoStack采訪了相芯科技資深圖形引擎開發經理蔡銳濤,他從個人成長聊到CG(Computer Graphics),再到電影《阿麗塔:戰斗天使》展現的空前的CG水平,并展望了5G帶來的人機交互的新方式。
Sisvel的VP9/AV1專利池將對視頻行業帶來哪些影響?
近期,Sisvel International S.A.公布了兩個新的專利池,提供VP9以及AV1相關技術的專利許可,并聲稱AV1和VP9中包含部分受到專利保護的技術。Sisvel會對AOM主推的AV1普及帶來何種影響,AOM對Sisvel是怎樣的態度將備受關注。
ZLMediaKit高并發實現原理
ZLMediaKit是一套高性能的流媒體服務框架,目前ZLMediaKit經過多次版本迭代,編程模型多次升級優化;已經趨于成熟穩定,也在各種生產環境得到了驗證,本文主要討論ZLMediaKit高性能實現原理以及項目特點。
傳輸網絡
Netty解決粘包和拆包問題的四種方案
本文首先會對粘包和拆包問題進行描述,然后介紹其常用的解決方案,最后會對Netty提供的幾種解決方案進行講解。
Google BBR擁塞控制算法背后的數學解釋
音頻/視頻技術
音視頻分析工具StreamEye介紹
Elecard StreamEye是一款視頻分析工具:可以從不同的角度分析視頻:TS級,ES級和實際的視頻級;方便分析視頻源,查找視頻源相關問題;通過檢查和分析視頻流,以調整編碼器,比較不同廠商的編碼器。
Chromium 視頻流請求與傳遞過程分析
Chromium 瀏覽器在處理類似 chrome.desktopCapture 這樣的視頻流請求的時候,大致流程是什么樣的呢?初步梳理了一下整個流程,流程還是比較長的,這里給出大概的類圖,但只說明其中部分的關鍵點。
語音識別傳統方法(GMM+HMM+NGRAM)概述
語音識別傳統方法主要分兩個階段:訓練和識別,訓練階段主要是生成聲學模型和語言模型給識別階段用。傳統方法主要有五大模塊組成,分別是特征提取,聲學模型、發音字典、語言模型、搜索解碼。
通過端到端的數據偵測提升QoS
通過收集網絡傳輸的數據,并采用更接近主觀主觀評價的客觀評價方式,可以有效反映QoS的水平,從而幫助運營方改進服務。
編解碼
CAE+VBR如何提升用戶體驗?
內容自適應編碼(CAE)產生的是動態碼率(VBR)視頻流,根據內容復雜性為視頻分配所需的碼率從而讓“編碼質量”與“碼率/帶寬/存儲空間”達到最佳平衡,為用戶提供最佳的體驗質量。
Versatile Video Coding(VVC)總結
JVET于2018年4月10日美國圣地亞哥會議上,為新一代視頻編碼標準定名為Versatile Video Coding,主要目標是改進現有HEVC,提供更高的壓縮性能,同時會針對新興應用(360°全景視頻和HDR)進行優化。
WebRTC的視頻解碼原理簡析
WebRTC的視頻部分,包含采集、編解碼(I420/VP8)、加密、媒體文件、圖像處理、顯示、網絡傳輸與流控(RTP/RTCP)等功能。
H.265與H.264的差異詳解
H.265仍然采用混合編解碼,編解碼結構域H.264基本一致,主要的不同在于:編碼塊劃分結構:采用CU (CodingUnit)、PU(PredictionUnit)和TU(TransformUnit)的遞歸結構;基本細節:各功能塊的內部細節有很多差異;并行工具:增加了Tile以及WPP等并行工具集以提高編碼速度;濾波器:在去塊濾波之后增加了SAO(sample adaptive offset)濾波模塊。
AI智能
移動端70+fps!谷歌新出高效實時視頻目標檢測
圖像目標檢測是圖像處理領域的基礎。自從2012年CNN的崛起,深度學習在Detection的持續發力,為這個領域帶來了變革式的發展:一個是基于RPN的two-stage,RCNN/Fast RCNN/Faster RCNN、RetinaNet、Mask RCNN等,致力于檢測精度的提高。一類是基于SSD和YOLOv1/v2/3的one-stage,致力于提高檢測速度。
視頻檢測(Video Detection)資源列表
近日,視頻檢測(Video Detection)受到廣泛的關注,小編為大家帶來了GitHub上視頻檢測合集列表。
滑動窗口也能用于實例分割,陳鑫磊、何愷明等人提出圖像分割新范式
滑動窗口在目標檢測中非常重要,然而最近何愷明等研究者表明,這個范式同樣可以用于實例分割。他們提出一條新的道路,即將密集實例分割看成一個在 4D 張量上進行的預測任務,這也就是 TensorMask 通用框架。
圖像
運動模糊濾鏡
運動模糊是指快速運動的物體造成明顯的模糊拖動痕跡;以簡單的直線運動為例,運動模糊應該具有兩個參數,分別是半徑長度和角度;
總結
以上是生活随笔為你收集整理的音视频技术开发周刊 93期的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: MSU高清/极慢档Codec对比:AV1
- 下一篇: 三十年TCP与七年QUIC 谁才是未来?