如果 AI 能帮我 | 社区征文
需要一个懂你的 AI
可以说,对于【如果有 AI 能帮我】的想法,在上学那会儿特别需要,只是那时候还没有 AI,上学那会儿,每天的学习量特别大,老师讲课普遍比较速度,因此课堂上很多内容都记不全,课下又没有参考可以整理,课业也就越来越落下,如果上学那会儿有 AI 的话比如阿里云的【通义听悟】,是不是就不会遗漏课堂上老师讲的任何的知识点了。
再说说工作后,在日常工作中,不管大公司小公司,产品需求的头脑风暴,创新 idea 的迸发,日常会议的记录等,可以说这些场景如果能有 AI 帮忙,那么会议记录,idea 记录等都不再是难事,通常的会议进程往往都比较快,没有记录的时间,过去也都是录音之后会议结束再记录,很是耽误时间且浪费精力。如果有【通义听悟】,那这些繁重无效的工作就可以轻松解决,是不是很方便。
说到通义听悟亮眼的功能,可以说对于大众来说,除了录音转文字,其他功能都可以算的上是通义听悟的亮眼功能。比如说会议实时转写,这就解决了会后花费大量时间转写会议记录的问题;再比如实时翻译,对于合资企业,多方人员的参与,语言的不统一,也是会议记录的一大难点,通义听悟实时翻译,正可以完美解决这一难点;再比如标记沟通要点,也就是说在会议过程中就可以把沟通要点提前锁定,节省了会后整理时间;再比如音字对应回听,可以保证音字的完全对应等。个人觉得整理会议纪要功能还有提升空间,目前还需要人工一键摘取会议转写内容,希望后续可以直接会议结束实时转写并且自动整理会议纪要,减少人工的涉及,需要人工插手的只是最后的人工审核一下。
对于通义听悟的应用场景,可以这么来想,通义听悟可以解决由语音实时转文字且支持翻译的操作,那么所有与人类语言交互的场景便都可以用上,比如物联网接入通义听悟,那么终端 IOT 设备将能更加准确的理解人类的语言命令;再比如导航设备接入通义听悟,那么你想去哪儿就真的可以做到说哪儿就去哪儿;再比如在线教育接入通义听悟,那么线上视频文字字幕既可以做到实时还可以保证准确,而无需再投入过多人力按视频插入文字;再有就是记者的现场采访,或者说人类与机器人的语音交互,都将会获得巨大的技术支持。总之,就是有人类语言沟通的场景,通义听悟都将有一席之地。
需要一个能画的 AI
可以说,AIGC 从我初次接触到现在已经发展了一段时间,在这个期间,各种场景的 AIGC 都去尝试过,最初的时候在 ModelScope,通过在线 Notebook,体验模型库中的 AIGC 相关的内容;到后来函数计算发布了 AIGC 相关的应用模板,于是也很开心的体验了多个应用模板;以及后来体验了基于 PAI-DSW 的 AIGC 的相关部署及文生图的操作,整体上可以说官方的文档已经尽可能的简化了小白新手在 AIGC 部署过程中可能遇到的问题。也就是说大家都可以很轻松的部署并体验 AIGC 的能力,只是在这个过程中,最大的难点不是怎么去部署,而是部署之后不太会用,不清楚当前部署版本的 AIGC 具体的训练程度,比如哪些场景已经训练到了,哪些场景又没有训练到,这样就导致在最后的体验上,有时候会觉得 AIGC 生成内容于自己提供的文本内容相差千里的感觉。不过我们还是体验到了 AI 场景下文生图的妙处。
可能你觉得只是用 AIGC 会没有太大的乐趣,但是你能接触到的 AIGC,你能接触到的 ChatGPT,也都是仅仅局限于使用,不过如果感兴趣的话可以去 【通义千问】一键部署通义千问预体验】感受一下。除了可以让你任意的使用,你还可以基于阿里云函数计算服务自己部署属于自己的 AIGC,部署属于自己的 ChatGPT,可以说这样的操作感受很真实。顺势而为,我体验了 AIGC 服务部署的【文生图】一键部署 Stable Diffusion 基于函数计算整个部署过程很流畅,操作也很简单,有需要的大家可以去参考我的博文,整个部署过程没有一点卡顿,最后的效果也是很好的,博文地址:小白上手AIGC-基于FC部署stable-diffusion,这里顺便给大家看一下我在基于函数计算部署过 AIGC 服务之后的访问效果图吧
版权声明: 本文为 InfoQ 作者【六月的雨在InfoQ】的原创文章。
原文链接:【http://xie.infoq.cn/article/170bc8a072ef4f9996613916e】。
本文遵守【CC-BY 4.0】协议,转载请保留原文出处及本版权声明。
评论