五月学习心得(二)
今天在学习专业知识之余,发现了声网 agora RTC 开发者社区里的一个专栏比较好,叫音视频杂谈,这里面有很多音视频内容的技术分享,像音频之深度学习文章四部曲、详解低延时高品质、实时互动技术展望这样的文章我觉得对于我自己来说是很有帮助的,虽然有很多知识自己已经了解,但是看完之后从撰写风格、文章架构上确实能有所收获。
比如晚上看的其中音频深度学习系列文章,前一两篇内容都在讲音频的基础知识,看完之后觉得人家写的比较完整,有理有据。对比自己的构思和想法,觉得应该在以后撰写的文章中增加基础知识的讲解,我现在总是想着以通俗易懂的方式来让读者能很快的入门,这样是优势,但是能使得内容更加充实,应该会更好。
该文章截取的都是比较经典的示意图,很有代表性。拿图片简单来说,就是从声音文件开始,将它们转换成声谱图,然后再将它们输入到 CNN 加线性分类器模型中,并产生关于声音所属类的预测。
文章链接:https://www.agora.io/cn/community/blog/123-category/21377
感兴趣的可以去看看音频四部曲(我自己给起的名字,哈哈)
关于其它的比如讲的实时互动中的空间音效这样的,也都很生动具体,先举例子,例如在“吃鸡”一类的游戏中,我们戴上耳机,可以利用声音带来的方位感来判断队友的位置;又或者是在听音乐、在线会议或 VR 应用中,空间音效可以让我们更有身临其境的感觉,然后又从声学角度来讲具体的空间音效的原理。类似这种的写作风格就很好,总的来说,对于今天我自己阅读这些文章来说,学到的技巧比其本身的内容要受益的多。
版权声明: 本文为 InfoQ 作者【攻城先森】的原创文章。
原文链接:【http://xie.infoq.cn/article/73cbca40f1bc06418cc2f1e2a】。未经作者许可,禁止转载。
评论