写点什么

连接 OpenAI 两大智能产品 Whisper & DALL·E,实现智能语音转文本 / 文本转图像

  • 2023-04-25
    北京
  • 本文字数:2120 字

    阅读完需:约 7 分钟

连接OpenAI两大智能产品Whisper & DALL·E,实现智能语音转文本/文本转图像

自集简云上线 ChatGPT 应用以来,已成功帮助数千家企业将人工智能接入自身办公系统。

集简云公司内部各系统中也全面接入了 ChatGPT 能力,大大提升了客服系统的服务质量,对于员工的工作效率也形成了极大的助力。

本周,集简云再度上线 OpenAI 两大智能产品,不仅丰富了人工智能领域的应用集成,也为广大用户提供更便捷和智能化的信息获取和视觉创作方式。

  • OpenAI Whisper :语音高效智能转换文本

  • OpenAI DALL·E :基于文本描述创作高质量图像

集简云让连接更简单​apps.jijyun.cn/plugcenter

下面,我们将分别介绍这两个新功能的应用场景和使用方式。

OpenAI Whisper 功能介绍

OpenAI Whisper 是由 OpenAI 团队开发的一款智能语音转文本工具,只需要提供一段录音或者音频文件,就可以快速将语音转换为文本内容。如果你是一名记者,或者是需要大量听取录音的从业者,OpenAI Whisper 将是你不可或缺的好帮手。

OpenAI Whisper 效果展示


▲自动识别录音转换文本,并使用 ChatGPT 自动生成录音总结

OpenAI Whisper 应用场景

OpenAI Whisper 语音转换文本功能能帮助用户实现更高效、准确地进行文字记录,编辑等功能,在商业和个人领域都具有广泛的应用前景:

  • 语音助手:将用户的语音命令或输入的语音内容转换成文本,进行进一步的处理和回答。

  • 视频及电话会议:将会议纪要语音转换为文本,使得会议记录更加准确,也方便后续的阅读和分析。

  • 客服服务:将客户语音的问题或请求转换成文本,减少人工处理时间,提高客户服务效率。

  • 医疗记录:对医生或护士在患者诊疗时的语音记录进行转换成文本,方便医生和护士们快速获取和整理患者的医疗信息和历史记录。

  • 语音翻译:Whisper 可以将一个语言的语音转换为相应的文字,再通过机器翻译算法将其翻译成目标语言的文本,使人们能够跨越语言和文化的障碍进行交流。

  • 讲座记录:对大型讲座或演讲的语音内容进行实时记录,使得听众可以更加专注于演讲内容,而不必担心遗漏笔记。

OpenAI Whisper 流程示例

明道云 + OpenAI Whisper + ChatGPT:通过将 SDR 外呼线索语音文字记录同步到明道云表格系统,并通过 ChatGPT3.5 对沟通记录进行总结与同步。


实现效果:当有新的大于 10s 的语音记录文件生成时,可自动将文字与录音总结同步到表单中。



流程介绍:

1 当明道云应用外呼记录表单有新的记录产生时,通过数据筛选应用将 10S 以上的语音记录作为筛选条件(此筛选条件规避掉沟通时间过短,或者电话被挂断的无效沟通

2 当语音记录被筛选通过后,即可通过 OpenAI Whisper 来将语音文件转化为文本,并将该文本作为文字沟通记录,同步到明道云表单中

3 将转化为文本的沟通记录,作为指令问题的一部分内容,让 OpenAI(ChatGPT)作为智能助手,根据该内容进行归纳和总结,并将总结内容返回到明道云进行记录。

OpenAI DALL·E 功能介绍

OpenAI DALL·E 是一款由 OpenAI 公司研发推出的人工智能图像生成应用,能够基于文本描述来创建图像,利用大规模的预训练神经网络和生成对抗网络技术,生成具有高度现实感的图像。

与传统图像生成器不同的是,DALL·E 不仅可以生成与现实世界中物体相似的图像,也可以创造出抽象的视觉概念,例如一个火柴人在海上冲浪。



集简云上线 OpenAI DALL·E ,无需开发就能快速将 OpenAI DALL·E 集成其他应用软件,进行图片创作、图片编辑和以图生图。

OpenAI DALL·E 效果展示

▲DALL・E 示例

给出一句话「牛油果形状的椅子」,就可以获得绿油油、形态各异的牛油果椅子图像。

小鹿在森林深处被萤火虫环绕


头带蝴蝶结的赛博朋克小狗


漫画风窝在沙发上的猫


OpenAI DALL·E 功能特点

  • 创意丰富:DALL·E 的输出图像非常丰富多样,它可以根据用户的文本描述创作出细节丰富的图像,包括动物、物品、场景等。从而帮助设计师快速生成各种图像,并提供多样化的选择,增强创造力和灵感。

  • 快速定制:如果有复杂的场景或物品需要设计,DALL·E 可以帮助用户快速定制,增强效率和准确性。

  • 节约时间成本:DALL·E 的创作速度很快,能够大大节省人工绘制图像的时间和成本。对于那些需要大量生成图像的工作,DALL·E 极大地提高了效率,同时还可以帮助降低人力成本。

  • 应用广泛:DALL·E 的应用非常广泛,比如设计、广告、出版、媒体、医学、教育等领域。它可以为这些领域提供更丰富的设计选择,增强创意和创造力。

OpenAI DALL·E 应用场景

  • 在设计领域中,它可以帮助设计师创建与产品相关的图像,包括海报、广告和包装设计,从而提高设计效率。

  • 在广告领域中,广告公司可以使用它设计出更具吸引力和创意性的广告和宣传材料。

  • 在医疗领域中,它可以用来生成医学图像,用于辅助疾病诊断和治疗计划制定。比如生成 3D 模型来辅助医生进行手术模拟。

  • 在游戏领域中,它可以用于游戏设计中的角色、道具、场景等元素的构建,或用于创建更互动、沉浸式的虚拟游戏体验。

如何开通

OpenAI Whisper 、 OpenAI DALL·E 需要在集简云插件中心开通应用,并消耗集简云账户余额。

开通路径:集简云平台 - 插件中心 - OpenAI Whisper / OpenAI DALL·E - 去开通 - 开通 ,即可开通对应资源包。



集简云: 让连接更简单


我们相信:业务流程自动化与智能化是企业新的增长引擎

官网地址:「集简云官网」软件集成可以如此简单

集简云-开发者平台​open.jijyun.cn/app/list?utm_source=zhihu&utm_medium=wenzhang&utm_campaign=whisper

发布于: 7 小时前阅读数: 24
用户头像

让您的系统拥有与600+款软件连接的能力 2023-03-21 加入

集简云开放平台是集简云为开发者(软件公司,企业内部开发者,独立开发者)提供快速与集简云平台中的应用进行连接的能力。

评论

发布
暂无评论
连接OpenAI两大智能产品Whisper & DALL·E,实现智能语音转文本/文本转图像_AI_集简云开放平台_InfoQ写作社区