Stack Exchange 知识开放共享:现已在 Snowflake Marketplace 提供高质量 AI 训练数据
Stack Exchange 知识面向所有人开放(现已在 Snowflake Marketplace 提供)
Snowflake 客户现在可以轻松地使用一些最受信任、最高质量的数据来丰富其 AI 应用和智能代理系统,同时尊重提供这些内容的社区成员并进行适当署名。
随着生成式 AI 工具在软件行业的普及,我们看到了在优质数据上训练语言模型的重要性日益增加。LLMs 提供知识的速度比大多数手动搜索更快,但不良数据无法转化为知识——“垃圾进,垃圾出”已成为 AI 行业的座右铭。高质量数据使 LLMs 能够准确高效地执行;不良数据则是一种负担。
这就是我们创建知识解决方案产品的原因:将 LLMs 和其他 AI 工具建立在 Stack Overflow 和许多 Stack Exchange 站点提供的高质量、经过验证且可信的答案基础上。我们的方法是确保以道德、负责任的方式使用数据,造福社区,同时回馈产生这一知识财富的社区。
到目前为止,我们已经找到了几位志同道合的合作伙伴,我们社区的工作正在帮助使他们的 AI 产品在事实上更加准确。个别合作伙伴关系帮助启动了这一过程,但我们希望将我们的高质量知识库交到每一家寻求数据以构建符合我们社会负责任 AI 愿景的 AI 解决方案的公司手中。例如,上个月,我们与 Moveworks 合作,在他们的市场中创建了 Stack Overflow 集成。
现在我们很高兴地宣布,Stack Overflow 数据已在 Snowflake Marketplace 上提供,并可以作为 Cortex 知识扩展得到支持。Snowflake 客户现在可以轻松地丰富其 AI 应用和智能代理系统(包括 Snowflake Intelligence),使用一些最受信任、最高质量的技术和非技术主题数据,同时尊重提供这些内容的社区成员并进行适当署名。
包括约 150 个 Stack Exchange 站点和 stackoverflow.com,因此如果您希望您的 AI 应用了解从 Ubuntu 到烹饪的一切,我们都能满足您的需求。数据包括问题、答案、评论、标签和投票:所有核心数据,由主题专家编写和验证,外加提供质量信号的元数据。只需最少的努力,所有这些都可以在 Snowflake 高度可扩展的平台上使用自然语言进行查询。
“与 Snowflake 的合作让我感到兴奋的是,这将我们已知的高质量数据交到全球更多专家手中,供他们使用并改善他们周围的世界,”Stack Overflow 数据科学与数据平台总监 Michael Foree 表示。“Snowflake 是我个人引入 Stack Overflow 的平台。他们使人们能够轻松地处理数据。通过与 Snowflake 合作,我们将宝贵的数据交到全球专家手中。”
AI 生态系统正在迅速发展,我们希望确保我们的数据无论走向何处都能在其中占有一席之地。研究表明,Stack Overflow 产生的结构化数据对于准确的 GenAI 至关重要。尊重这些数据的来源——我们的社区——是我们使命和未来生存的核心。通过与 Snowflake 合作,我们确保我们跨领域的知识宝库能够推动 AI 生态系统的进步,使我们所有人更高效,对 AI 工具的输出更有信心。
这种合作伙伴关系对我们的社区来说也是一次重大胜利。Stack Overflow 已成为一系列专家值得信赖的知识来源。署名要求将认可这些专家的工作,并增加用户对基于此构建的 AI 应用的信任。我们的 CEO Prashanth Chandrasekar 在 HumanX 上谈到了信任的价值:“当人们冒着风险使用这些 AI 工具时,他们希望确保能够依赖它。通过在链接和引用中提供署名,您将这些 AI 答案建立在真实的基础上。”
GenAI 长期以来一直是最令人兴奋的技术之一。在我们了不起的社区的帮助下,我们可以使它更加可靠。更多精彩内容 请关注我的个人公众号 公众号(办公 AI 智能小助手)公众号二维码

评论