音视频技术开发周刊 | 193
每周一期,縱覽音視頻技術領域的干貨。
新聞投稿:contribute@livevideostack.com。
小提示:鏈接跳轉僅支持公眾號相關鏈接
體驗共享——技術實現瓶頸與突破
雖然音視頻技術日趨成熟,但是不同場景對音視頻的需求有不同側重。為了將體驗做到極致,音視頻技術平臺也面臨著很大的挑戰。我們邀請到了即構科技邱國欽老師,為大家介紹多媒體場景中新的體驗場景面臨的挑戰,以及該如何應對這些挑戰。
美攝智能視頻生產平臺
美攝科技為企業提供視頻編輯SDK、短視頻SDK服務,支持開發者快速集成包括視頻錄制/視頻編輯/視頻美顏/人臉識別/動態貼紙/特效濾鏡,支持iOS/Android視頻編輯SDK功能。今天我們有請到美攝科技的李磊老師和我們分享一些思考一些實踐以及現有的方案。
流媒體的未來——視頻技術如何演變
本次LiveVideoStackCon 2021上海站我們邀請到了Akamai紀永康分享播放器、格式和容器編解碼和視頻內容準備,網絡協議和數據傳輸,互聯網流量增長趨勢。
LibAOM與AV1的最新研發進展
本次分享我們邀請到了來自Google Open Codec Team的韓敬寧博士,他向我們分享了AV1解碼器的覆蓋,AV1編碼器性能的提升包括AV1壓縮性能的提升和運算復雜度的降低,AV1實時編碼器的應用和基于AV1的圖像編碼器格式AVIF的最新研究進展。
建立優化的端到端視頻工作流所需的一切
通過互聯網或OTT(OTT)傳送的電影和電視內容的增加自然就意味著市場上OTT服務的增加。如果您提供流媒體之類的視頻服務,那么您就知道將視頻分發到設備,管理數據以及收集有關觀眾行為的分析的過程可能是復雜,耗時的,有時甚至是不堪重負的。因此,讓我們談談如何將所有流程簡化為優化的視頻工作流程吧。
https://bitmovin.com/optimized-end-to-end-video-workflow/
實時視頻質量控制
實時流媒體一直是迪士尼流媒體服務(DSS)視頻技術的一個組成部分。DSS擁有多個團隊,其主要職能是盡可能保持最高的視頻質量,并確保內容傳輸技術24/7正常工作。
Simon Says:使視頻編輯像文本編輯一樣簡單
本次內容來自DEMUXED,演講者是Simon Says的首席技術官Roderick Hodgson Roderick 向我們介紹了一種工具:simon says組件,以及其中的一些技術挑戰。
探討TensorRT加速AI模型的簡易方案 — 以圖像超分為例
本次LiveVideoStack線上分享邀請到了英偉達DevTech團隊技術負責人季光一起探討把模型運行到TensorRT的簡易方法,幫助GPU編程的初學者加速自己的AI模型。
2021年如何在不使用Wifi或以太網的情況下進行遠程直播
在本文中,我們將介紹當Wifi和以太網不可用時如何遠程直播數據流。我們將首先回顧一些可能影響網絡可用性的情況。考慮到這一點,我們將研究一些與網絡綁定有關的可能解決方案,這些解決方案使遠程實時流媒體變得更實惠且更簡單。
https://www.dacast.com/blog/streaming-live-remote/
阿里云 RTC QoS 弱網對抗之 LTR 及其硬件解碼支持
LTR 弱網對抗由于需要解碼器的反饋,因此用硬件解碼器實現時需要做一些特殊處理。另外,一些硬件解碼器對 LTR 的實現不是特別完善,會導致出現解碼錯誤。本文為 QoS 弱網優化系列的第三篇,將為您詳解阿里云 RTC QoS 策略中的 LTR 抗弱網原理與實現硬解 LTR 時遇到的坑及其相應解法。
FFmpeg 音視頻開發 20 年
從2007年之前,到2008-2017年,再到2017之后,作者chenchao_shenzhen以時間為軸講述了FFmpeg歷經20年的發展進程以及未來趨勢。
https://blog.csdn.net/chenchao_shenzhen/article/details/111532282
我們不必等到2027年才能從AV1中受益
我們生活在一個擁有強大處理能力的地方,為改善視頻體驗提供了很多機會。軟件解碼是可能的,并且有一些解決方案可以通過今年(而不是幾年)提供高質量的優質服務來增強AV1的潛力,使其變得可行。
https://www.streamingmediablog.com/2021/04/av1-timeline.html
Lyra,Satin 和 WebRTC 中語音編解碼器的未來
新的音頻編解碼器:Google Lyra和Microsoft Satin。兩家公司都采取基于AI的語音編碼,并且都將爭取將其納入WebRTC。
https://bloggeek.me/lyra-satin-webrtc-voice-codecs/
像人一樣自然流暢地說話,下一代智能對話系統還有多長的路要走?
對話系統在最近幾年發展非常迅速,特別在 NLP 頂會上的論文數量逐步增多。如果說,自然語言處理是 AI 皇冠上的明珠,那么對話系統就是「NLP 皇冠上的明珠」,并且以蘋果 Siri 等為代表的的任務型對話和以微軟小冰為代表的非任務型(聊天型)對話尤為受到學界和業界關注。
AI 發展方向大爭論:混合AI ?強化學習 ?將實際知識和常識整合到AI中 ?
對于AI界來說意義重大,這歸功于深度學習領域取得了驚人的進步,AI的這個分支因收集、存儲和處理大量數據的能力不斷增強而變得切實可行。如今,深度學習不僅是一個科學研究課題,還是許多日常應用系統的一個關鍵組成部分。
帶有包圍式曝光功能的HDR+改善手機圖像質量
我們正在通過常規更新(例如最近對Camera應用程序的V8.2更新)不斷努力改進Pixel,使它更有用,更強大,更有趣。其中一項改進(于10月在Pixel 5和Pixel 4a 5G上推出)是一項功能,該功能“在幕后”運行,帶包圍曝光的HDR +。此功能通過合并以不同曝光時間拍攝的圖像來改善圖像質量(特別是在陰影中),從而產生更自然的色彩,改善的細節和紋理并減少噪點。
https://ai.googleblog.com/2021/04/hdr-with-bracketing-on-pixel-phones.html
在目標檢測中如何解決小目標的問題?
在深度學習目標檢測中,特別是人臉檢測中,由于分辨率低、圖像模糊、信息少、噪聲多,小目標和小人臉的檢測一直是一個實用和常見的難點問題。然而,在過去幾年的發展中,也出現了一些提高小目標檢測性能的解決方案。本文將對這些方法進行分析、整理和總結。
Vulkan Video實現GPU加速視頻編碼/解碼
Vulkan是一套跨平臺的圖形API,由Khronos組織牽頭進行制定,普遍被看作是OpenGL的后繼者,目前版本已經來到1.2.175,仍然在不停地進行更新,其在非Windows平臺上面已經逐漸變成了首選使用的圖形API。在未來,Vulkan甚至會提供模擬DirectX等其他圖形API的功能,有很大的發展前景。
Facebook計劃通過一套新的音頻產品來追趕Clubhouse和Podcast
關于Facebook下一步的音頻計劃。
https://www.vox.com/recode/2021/4/18/22390742/facebook-podcasts-clubhouse-audio-launch-spotify-zuckerberg-apple
AMD Link更新支持在電腦上運行 從一個PC串流到另一個
AMD正在為其Radeon Adrenaline軟件套裝推出一個大更新,將改進遠程游戲和一些輔助設置。這個套裝是Radeon顯卡自帶的,可以讓游戲玩家最大化利用他們的硬件。
https://www.cnbeta.com/articles/tech/1119795.htm
講師招募?LiveVideoStackCon 2021 北京站
LiveVideoStackCon 2021 北京站(9月3-4日)正在面向社會公開招募講師,歡迎通過?speaker@livevideostack.com?提交個人及議題資料,無論你的公司大小,title高低,老鳥還是菜鳥,只要你的內容對技術人有幫助,其他都是次要的,我們將會在24小時內給予反饋。
插圖源自creativeboom.com
總結
以上是生活随笔為你收集整理的音视频技术开发周刊 | 193的全部內容,希望文章能夠幫你解決所遇到的問題。
 
                            
                        - 上一篇: LiveVideoStack主编观察04
- 下一篇: 进入全真互联网——音视频通信的技术变革
