写点什么

五月学习心得(二)

用户头像
攻城先森
关注
发布于: 2021 年 05 月 09 日
五月学习心得(二)

今天在学习专业知识之余,发现了声网 agora RTC 开发者社区里的一个专栏比较好,叫音视频杂谈,这里面有很多音视频内容的技术分享,像音频之深度学习文章四部曲、详解低延时高品质、实时互动技术展望这样的文章我觉得对于我自己来说是很有帮助的,虽然有很多知识自己已经了解,但是看完之后从撰写风格、文章架构上确实能有所收获。

比如晚上看的其中音频深度学习系列文章,前一两篇内容都在讲音频的基础知识,看完之后觉得人家写的比较完整,有理有据。对比自己的构思和想法,觉得应该在以后撰写的文章中增加基础知识的讲解,我现在总是想着以通俗易懂的方式来让读者能很快的入门,这样是优势,但是能使得内容更加充实,应该会更好。

截取音频四部曲中的图片

该文章截取的都是比较经典的示意图,很有代表性。拿图片简单来说,就是从声音文件开始,将它们转换成声谱图,然后再将它们输入到 CNN 加线性分类器模型中,并产生关于声音所属类的预测。

文章链接:https://www.agora.io/cn/community/blog/123-category/21377

感兴趣的可以去看看音频四部曲(我自己给起的名字,哈哈)

关于其它的比如讲的实时互动中的空间音效这样的,也都很生动具体,先举例子,例如在“吃鸡”一类的游戏中,我们戴上耳机,可以利用声音带来的方位感来判断队友的位置;又或者是在听音乐、在线会议或 VR 应用中,空间音效可以让我们更有身临其境的感觉,然后又从声学角度来讲具体的空间音效的原理。类似这种的写作风格就很好,总的来说,对于今天我自己阅读这些文章来说,学到的技巧比其本身的内容要受益的多。

发布于: 2021 年 05 月 09 日阅读数: 19
用户头像

攻城先森

关注

爱思考的小王学长 2021.04.23 加入

计算机在读硕士,两年ASR、Deep Learning学习开发经验

评论

发布
暂无评论
五月学习心得(二)