写点什么

视频云

0 人感兴趣 · 65 次引用

  • 最新
  • 推荐
https://static001.geekbang.org/infoq/80/8010e9d96f0e18a84f3aba52f50d2b53.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

从《中国视频云市场跟踪》最新报告,看视频云的赛道演进

国际权威咨询公司IDC发布,《中国视频云市场跟踪(2021 H2)》报告,阿里云连续四年稳居中国视频云整体市场份额第一,整体市场份额占比达26.9%。

https://static001.geekbang.org/infoq/69/6971bed3516264981b93bac3341c721c.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

从云原生到智能化,深度解读行业首个「视频直播技术最佳实践图谱」

在2022阿里云直播峰会上,多位直播产业领域技术专家与行业先行者,共同探讨超视频化时代视频直播技术的演进趋势与未来发展。会上,阿里云重磅发布了行业首个「视频直播技术最佳实践图谱」,将直播技术归纳总结为7点:云原生、高可靠、低延时、超高清、智能化

字节跳动 CVPR 2022 多项目夺魁,获模拟人脑感知、长视频理解挑战双料冠军

一年一度AI计算机视觉领域的顶级盛会CVPR 2022已经落下帷幕。字节跳动极光-多模态技术团队、智能创作团队、火山引擎多媒体实验室团队斩获了多项竞赛冠军,覆盖「视觉问答」、「图像实例分割」、「长视频内容理解」,以及「图片视频压缩技术」等方向。

https://static001.geekbang.org/infoq/6a/6abc455d006c3b068dcb9b5c3e63623a.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

隔空手势交互,如何在现实世界上演“得心应手”?

手,作为人体最灵活的器官,参与我们生活的方方面面;手,是除了眼睛之外能直接感受三维世界和物体的器官;手,作为无声的交互工具,已经在计算机领域占了无比重要的地位。

https://static001.geekbang.org/infoq/72/72dcb39dd6bf451e357cabde30d2b4ce.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

AliIAC 智能音频编解码器:在有限带宽条件下带来更高质量的音频通话体验

随着信息技术的发展,人们对实时通信的需求不断增加,并逐渐成为工作生活中不可或缺的一部分。每年海量的音视频通话分钟数对互联网基础设施提出了巨大的挑战。尽管目前全球的互联网用户绝大多数均处于良好的网络状况,但仍有不少地区处于极差的网络条件下,除

https://static001.geekbang.org/infoq/e5/e5ff1f2c207b4920e947eaffcddd4a77.jpeg?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

极致体验,揭秘抖音背后的音视频技术

近两年,音视频技术展现了迅猛的发展势头,在短视频、直播、在线会议、教育等行业都有亮眼的应用案例,已经逐渐成为新时代互联网的基础设施之一。音视频技术对清晰、流畅、实时有着核心要求,但在实际的落地过程中,行业中仍存在诸多痛点问题亟待解决。

https://static001.geekbang.org/infoq/75/75c82dd0b3b94d3e750cc017260da72a.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

打破虚拟边界的视频交互新方式,AR 隔空书写的应用理念和探索实践

随着技术的发展和超视频化的时代驱动,交互的形式日渐丰富。从屏幕点触,到语音交互,人脸、指纹、声纹,再到近年流行的AR和VR……人类早在语言出现之前便习惯使用肢体和手势这种近乎本能的沟通方式来进行交流,作为最基础和自然的交互方式,手势交互的应用场

https://static001.geekbang.org/infoq/9b/9bcbb9dbba59edd16864546a53ea894d.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

CVPR2022 前沿研究成果解读:基于生成对抗网络的深度感知人脸重演算法

凭借在人脸生成领域的扎实积累和前沿创新,阿里云视频云与香港科技大学合作的最新研究成果《基于生成对抗网络的深度感知人脸重演算法 》(Depth-Aware Generative Adversarial Network for Talking Head Video Generation)被 CVPR2022 接收。本文为最新研究

https://static001.geekbang.org/infoq/28/289796c54547c017d54cc03a7236e76e.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

阿里云视频云人脸生成领域最新研究成果入选 CVPR2022

CVPR(IEEE Conference on Computer Vision and Pattern Recognition)作为计算机视觉和模式识别领域的顶级会议,在全球具有极高的权威性。目前在中国计算机学会推荐国际学术会议的排名中,CVPR为人工智能领域的A类会议 。

https://static001.geekbang.org/infoq/b5/b5ed04f3ab7953264d3d4838ee88424a.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

火山引擎支持 Pico 完成业界首场 8K 3D 实时互动 VR 演唱会

4 月 9 日晚,Pico 独家直播了 2022 王晰 “图景”个人巡回音乐会,这是业界第一场面向公众的 8K 3D VR 演唱会。

https://static001.geekbang.org/infoq/48/4893a5da57ca883adaab48868a3252ad.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

AliPLC 智能丢包补偿算法, 提升弱网环境的通话质量

在线视频/语音通话逐渐成为人们日常生活的一部分,而复杂多变的网络环境会导致部分音频包无法传送到接收端,造成语音信号的短时中断或者卡顿,这会严重影响通话体验,为解决这类问题,阿里云视频云音频技术团队在综合考虑效果、性能开销、实时性等诸多因素后

https://static001.geekbang.org/infoq/5c/5cbc45f1de23937450c2d7310ba9eaeb.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

如何在云端重塑内容生产?来看这场虚拟人主持的发布会

3月30日,阿里云视频云在线上举行了一场由虚拟人助力主持的「智能媒体生产」产品升级发布会,活动围绕产品能力的展现、视频生产流程的革新、高效生产背后的技术先进性,阐释了企业如何在云端重塑视频内容生产的全流程,打造云端内容制作新范式。

https://static001.geekbang.org/infoq/cf/cf1ecfdbce1ac4b4f53f31205753cb77.jpeg?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

Ali266 首次商用落地,助力优酷码率最高节省 40%

阿里云自研编码器Ali266于2022年1月在优酷正式上线,这是已知的业界首个H.266/VVC标准的编码器商用落地项目。经过两个月的实际运行数据显示,开启Ali266后,同等画面清晰度的情况下比原H.265/HEVC方案码率最高节省40%,卡顿率降低50%,充分证明了Ali266的商用

https://static001.geekbang.org/infoq/9b/9bfd2cde2b6cd86bbc62a3cfbee2f71b.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

带你了解 2022 两会黑科技:阿里云视频云「AI 编辑部 3.0」

 5G链接前后方,AI直抵采访一线,视频生产的云端化和移动化,重塑了媒体生产与传播的全流程,“AI编辑部”助力人民日报新媒体全链路上云,由此,轻量化、智能化的AI编辑部让每一次两会报道都更“劲”一步。

https://static001.geekbang.org/infoq/1e/1e18d1bd7b50017fa4dc934901da138e.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

ICASSP 2022 | 前沿音视频成果分享:基于可变形卷积的压缩视频质量增强网络

阿里云视频云视频编码与增强技术团队最新研究成果论文《基于可变形卷积的压缩视频质量增强网络》(Deformable Convolution Dense Network for Compressed Video Quality Enhancement)已被 ICASSP 2022 Image, Video & Multidimensional Signal Processing 主

https://static001.geekbang.org/infoq/52/528a967709fe3f0e282ab5271d876a37.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

语音顶会 ICASSP 2022 成果分享:基于时频感知域模型的单通道语音增强算法

近日,阿里云视频云音频技术团队与新加坡国立大学李海洲教授团队合作论文 《基于时频感知域模型的单通道语音增强算法 》(Time-Frequency Attention for Monaural Speech Enhancement ) 被 ICASSP 2022 接收, 并受邀于今年 5 月在会议上向学术和工业界做研究报

https://static001.geekbang.org/infoq/5b/5b64a5cb8aa7d7e2b5af2e54a6777145.jpeg?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

解码北京冬奥沉浸式报道黑科技: 阿里云视频云「互动虚拟演播技术」

这个冬奥季,即便你在冰雪之外,也能透过播报感受同在。这就是互动虚拟演播技术带来的。

https://static001.geekbang.org/infoq/99/9976fac83797a79748d2f17dec15ddb9.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

揭秘 2022 冬奥黑科技,阿里云视频云「Cloud ME」如何实现全息会面?

2022北京冬奥会本是一届非凡的存在,这是有史以来第一次将奥运会所需的全部核心系统全面上云,以数字化技术创造奥运的新纪元。

https://static001.geekbang.org/infoq/49/49e720299af7d3d784228979d8872554.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

阿里云视频云「 vPaaS 」演绎了怎样的音视频应用开发「未来图景」?

vPaaS是阿里云视频云最新推出的低代码音视频应用开发产品,其中,vPaaS低代码音视频工厂,彻底打破了音视频应用的繁冗技术开发壁垒;vPaaS视频原生应用开发平台,全新定义了音视频应用的开发方式。

https://static001.geekbang.org/infoq/60/60f2b40b0e91f600bf83bb5f69beefa5.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

阿里云视频云 vPaaS 低代码音视频工厂:极速智造,万象空间

当下音视频技术越来越广泛地应用于更多行各业中,但因开发成本高、难度系数大等问题,掣肘了很多企业业务的第二增长需求。阿里云视频云基于云原生、音视频、人工智能等先进技术,提供易接入、强拓展、高效部署和覆盖多场景的音视频服务——vPaaS低代码音视频

https://static001.geekbang.org/infoq/b0/b085906e07126a39f74ecb9358d402af.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

低代码音视频开发训练营正在火热报名中!

2022年1月5日,阿里云视频云资深技术专家即低代码音视频工厂研发负责人重磅发布“低代码音视频开发训练营”,阿里云视频云专家亲自授课,讲解vPaaS架构、技术特性与演进方向,带领学员们一起完成低代码音视频工厂的实战,迅速集成高品质音视频能力。本次开营

https://static001.geekbang.org/infoq/f0/f092dd40a219f83cb2f47a1613f35e72.jpeg?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

从直播硬件出发,浅析直播技术到物联网设备的智能化趋势

直播有个人直播(泛娱乐直播)和企业直播(商业&商务直播)之分;个人直播的投入成本低,一部手机便可以随时随地开播,且各直播App有足够多的直播辅助工具来协助开播,对增值服务需求不高;企业直播讲究规范,有专门的直播间,投入的人力物力很大,直播影响面

基于 Serverless 的端边云一体化媒体网络

​​摘要:视频在边缘的创新方向在哪?下一代视频云平台什么样?

ICCV 2021 口罩人物身份鉴别全球挑战赛冠军方案分享

10月11-17日,万众期待的国际计算机视觉大会 ICCV 2021 (International Conference on Computer Vision) 在线上如期举行,受到全球计算机视觉领域研究者的广泛关注。今年阿里云多媒体 AI 团队(由阿里云视频云和达摩院视觉团队组成)参加了 MFR 口罩人物身份

拥抱智能,AI 视频编码技术的新探索

随着视频与交互在日常生活中的作用日益突显,愈发多样的视频场景与不断提高的视觉追求对视频编码提出更高的挑战。相较于人们手工设计的多种视频编码技术,AI 编码可以从大数据中自我学习到更广泛的信号内在编码规律。工业界与学术界发力推动 AI 视频编码标准

软硬一体的算法实践,阿里云如何以算法实现场景 “再创新”?

音视频消费的新场景催生了越来越多新的技术需求,从当下的直播、点播、RTC,到未来的 XR 和元宇宙,音视频技术对新场景的支撑越来越趋向于综合性,近年来 AI 算法发展迅猛,但是较好的算法效果往往需要消耗很大的算力资源,这使算法商业化落地面临非常大的挑

编解码再进化:Ali266 与下一代视频技术

过去的一年见证了人类百年不遇的大事记,也见证了多种视频应用的厚积薄发。而因此所带来的视频数据量的爆发式增长更加加剧了对高效编解码这样的底层硬核技术的急迫需求。

https://static001.geekbang.org/infoq/d3/d3b75e62353d3f20ccb2aa538bfebabb.jpeg?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

AliRTC 开启视频互动 “零计算” 时代

在 2021 云栖大会《产业视频化创新与最佳实践》视频云主题论坛中,阿里云智能高级技术专家在《AliRTC 开启视频互动 "零处理" 时代》的主题演讲中,发布了阿里云视频云下一代实时交互解决方案 —RTC “零处理”,同时分享了阿里云视频云在 RTC 产品的探索和实

视频云_视频云技术文章_InfoQ写作社区