连接 OpenAI 两大智能产品 Whisper & DALL·E,实现智能语音转文本 / 文本转图像
自集简云上线 ChatGPT 应用以来,已成功帮助数千家企业将人工智能接入自身办公系统。
集简云公司内部各系统中也全面接入了 ChatGPT 能力,大大提升了客服系统的服务质量,对于员工的工作效率也形成了极大的助力。
本周,集简云再度上线 OpenAI 两大智能产品,不仅丰富了人工智能领域的应用集成,也为广大用户提供更便捷和智能化的信息获取和视觉创作方式。
OpenAI Whisper :语音高效智能转换文本
OpenAI DALL·E :基于文本描述创作高质量图像
集简云让连接更简单apps.jijyun.cn/plugcenter
下面,我们将分别介绍这两个新功能的应用场景和使用方式。
OpenAI Whisper 功能介绍
OpenAI Whisper 是由 OpenAI 团队开发的一款智能语音转文本工具,只需要提供一段录音或者音频文件,就可以快速将语音转换为文本内容。如果你是一名记者,或者是需要大量听取录音的从业者,OpenAI Whisper 将是你不可或缺的好帮手。
OpenAI Whisper 效果展示
▲自动识别录音转换文本,并使用 ChatGPT 自动生成录音总结
OpenAI Whisper 应用场景
OpenAI Whisper 语音转换文本功能能帮助用户实现更高效、准确地进行文字记录,编辑等功能,在商业和个人领域都具有广泛的应用前景:
语音助手:将用户的语音命令或输入的语音内容转换成文本,进行进一步的处理和回答。
视频及电话会议:将会议纪要语音转换为文本,使得会议记录更加准确,也方便后续的阅读和分析。
客服服务:将客户语音的问题或请求转换成文本,减少人工处理时间,提高客户服务效率。
医疗记录:对医生或护士在患者诊疗时的语音记录进行转换成文本,方便医生和护士们快速获取和整理患者的医疗信息和历史记录。
语音翻译:Whisper 可以将一个语言的语音转换为相应的文字,再通过机器翻译算法将其翻译成目标语言的文本,使人们能够跨越语言和文化的障碍进行交流。
讲座记录:对大型讲座或演讲的语音内容进行实时记录,使得听众可以更加专注于演讲内容,而不必担心遗漏笔记。
OpenAI Whisper 流程示例
明道云 + OpenAI Whisper + ChatGPT:通过将 SDR 外呼线索语音文字记录同步到明道云表格系统,并通过 ChatGPT3.5 对沟通记录进行总结与同步。
实现效果:当有新的大于 10s 的语音记录文件生成时,可自动将文字与录音总结同步到表单中。
流程介绍:
1 当明道云应用外呼记录表单有新的记录产生时,通过数据筛选应用将 10S 以上的语音记录作为筛选条件(此筛选条件规避掉沟通时间过短,或者电话被挂断的无效沟通
2 当语音记录被筛选通过后,即可通过 OpenAI Whisper 来将语音文件转化为文本,并将该文本作为文字沟通记录,同步到明道云表单中
3 将转化为文本的沟通记录,作为指令问题的一部分内容,让 OpenAI(ChatGPT)作为智能助手,根据该内容进行归纳和总结,并将总结内容返回到明道云进行记录。
OpenAI DALL·E 功能介绍
OpenAI DALL·E 是一款由 OpenAI 公司研发推出的人工智能图像生成应用,能够基于文本描述来创建图像,利用大规模的预训练神经网络和生成对抗网络技术,生成具有高度现实感的图像。
与传统图像生成器不同的是,DALL·E 不仅可以生成与现实世界中物体相似的图像,也可以创造出抽象的视觉概念,例如一个火柴人在海上冲浪。
集简云上线 OpenAI DALL·E ,无需开发就能快速将 OpenAI DALL·E 集成其他应用软件,进行图片创作、图片编辑和以图生图。
OpenAI DALL·E 效果展示
▲DALL・E 示例
给出一句话「牛油果形状的椅子」,就可以获得绿油油、形态各异的牛油果椅子图像。
小鹿在森林深处被萤火虫环绕
头带蝴蝶结的赛博朋克小狗
漫画风窝在沙发上的猫
OpenAI DALL·E 功能特点
创意丰富:DALL·E 的输出图像非常丰富多样,它可以根据用户的文本描述创作出细节丰富的图像,包括动物、物品、场景等。从而帮助设计师快速生成各种图像,并提供多样化的选择,增强创造力和灵感。
快速定制:如果有复杂的场景或物品需要设计,DALL·E 可以帮助用户快速定制,增强效率和准确性。
节约时间成本:DALL·E 的创作速度很快,能够大大节省人工绘制图像的时间和成本。对于那些需要大量生成图像的工作,DALL·E 极大地提高了效率,同时还可以帮助降低人力成本。
应用广泛:DALL·E 的应用非常广泛,比如设计、广告、出版、媒体、医学、教育等领域。它可以为这些领域提供更丰富的设计选择,增强创意和创造力。
OpenAI DALL·E 应用场景
在设计领域中,它可以帮助设计师创建与产品相关的图像,包括海报、广告和包装设计,从而提高设计效率。
在广告领域中,广告公司可以使用它设计出更具吸引力和创意性的广告和宣传材料。
在医疗领域中,它可以用来生成医学图像,用于辅助疾病诊断和治疗计划制定。比如生成 3D 模型来辅助医生进行手术模拟。
在游戏领域中,它可以用于游戏设计中的角色、道具、场景等元素的构建,或用于创建更互动、沉浸式的虚拟游戏体验。
如何开通
OpenAI Whisper 、 OpenAI DALL·E 需要在集简云插件中心开通应用,并消耗集简云账户余额。
开通路径:集简云平台 - 插件中心 - OpenAI Whisper / OpenAI DALL·E - 去开通 - 开通 ,即可开通对应资源包。
集简云: 让连接更简单
我们相信:业务流程自动化与智能化是企业新的增长引擎
官网地址:「集简云官网」软件集成可以如此简单
集简云-开发者平台open.jijyun.cn/app/list?utm_source=zhihu&utm_medium=wenzhang&utm_campaign=whisper
版权声明: 本文为 InfoQ 作者【集简云开放平台】的原创文章。
原文链接:【http://xie.infoq.cn/article/63065790c6fa30aad7cb39d88】。文章转载请联系作者。
评论