写点什么

Towhee

0 人感兴趣 · 16 次引用

  • 最新
  • 推荐

ToolLLM:能够使用 16000 种真实 API 的 LLM

用户头像
Zilliz
08-10

随着对 LLM(大语言模型)的了解与使用越来越多,大家开始偏向于探索 LLM 的 agent 能力。尤其是让 LLM 学习理解 API,使用工具进行对用户的 instruction(指令)进行处理。然而,目前的开源大模型并不擅长使用工具,最善于使用工具的 ChatGPT 是闭源的模型。

Video-LLaMA 开源,大语言模型也能读懂视频了!

用户头像
Zilliz
06-15

本文设计了两个分支,即视觉语言分支和音频语言分支,分别将视频帧和音频信号转换为与 LLM 的文本输入兼容的查询表示。

单卡轻松打造 ChatGPT 竞争者“原驼”,QLoRA 革新大语言模型微调技术

用户头像
Zilliz
06-01

QLoRA 在降低大模型微调成本的同时,也保证了性能的提升。它只需要一张消费级显卡,就能在两天内获得一个99+%近似 ChatGPT 的大语言模型。其论文一经发布就受到了业内广泛关注,是目前热度最高的AI论文之一。

大象转身只需点点鼠标,爆火 DragGAN 原理浅析

用户头像
Zilliz
05-25

通过 DragGAN,任何人都可以通过精确控制像素的位置对图像进行变形,从而操纵动物、汽车、人类、风景等不同类别的姿势、形状、表情和布局。定性和定量比较都证明了 DragGAN 在图像处理和点跟踪任务中优于先前方法的优势。

ControlNet: 控制扩散模型的魔法

用户头像
Zilliz
05-17

从去年以来 AIGC 的技术不断冲击人们的想象力,针对图片的扩散模型(midjourney 和 stable diffusion)已经可以在给于 prompt 下生成非常吸引人的图像

2023 开源之夏|和 Milvus & Towhee 一起玩转 AI、享开源、得奖金

用户头像
Zilliz
05-10

如果你想在暑期生活中感受 “AI+Vector Database” 赛道编程体验,如果你想在感受前沿技术的同时顺便收获高额奖金(8000~12000元),不要犹豫,赶快加入我们!

HuggingGPT 强势来袭,LLM+ 专家模型,迈向更通用的 AI

用户头像
Zilliz
04-13

HuggingFace + ChatGPT = HuggingGPT强势来袭。人类仿佛距离真正的AGI又更近了一步。

触手可及的 GPT —— LLaMA

用户头像
Zilliz
04-06

最近几个月 ChatGPT 的出现引起广泛的关注和讨论,它在许多领域中的表现都超越了人类的水平。它可以生成人类级别的语言,并且能够在不同的任务中学习和适应,让人们对人工智能的未来充满了希望和憧憬。

https://static001.geekbang.org/infoq/32/3256b0d0a63bdbf3e85a4dd26435d158.jpeg?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

EfficientFormerV2 加速 ViT,更高效的移动端视觉模型

用户头像
Zilliz
01-13

EfficientFormerV2 仿造卷积结构的MobileNet,对 transformers 进行一系列针对移动端加速的设计和优化。

https://static001.geekbang.org/infoq/85/855ef5c596f8dd4c99a64e7738367cc4.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

手把手搭建视频查重系统

用户头像
Zilliz
2022-12-09

本文将介绍如何利用 Milvus 和 Towhee 搭建一个视频查重系统

https://static001.geekbang.org/infoq/b1/b142d781e26108e569c4704f995264ab.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

5 分钟实现「视频检索」:基于内容理解,无需任何标签

用户头像
Zilliz
2022-11-18

在这篇文章中,我们将会使用 Milvus 和 Towhee 搭建一个基于内容理解的「视频检索」服务!

https://static001.geekbang.org/infoq/cc/cca75c4c682d57121eafe346483e6929.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

5 分钟教你搭建「视频动作分类」系统

用户头像
Zilliz
2022-11-16

本文主要介绍了如何使用非结构化数据 ETL 平台 Towhee 搭建一个「视频动作分类」系统。

Towhee_Towhee技术文章_InfoQ写作社区