Towhee
0 人感兴趣 · 16 次引用
- 最新
- 推荐
ToolLLM:能够使用 16000 种真实 API 的 LLM
随着对 LLM(大语言模型)的了解与使用越来越多,大家开始偏向于探索 LLM 的 agent 能力。尤其是让 LLM 学习理解 API,使用工具进行对用户的 instruction(指令)进行处理。然而,目前的开源大模型并不擅长使用工具,最善于使用工具的 ChatGPT 是闭源的模型。
大象转身只需点点鼠标,爆火 DragGAN 原理浅析
通过 DragGAN,任何人都可以通过精确控制像素的位置对图像进行变形,从而操纵动物、汽车、人类、风景等不同类别的姿势、形状、表情和布局。定性和定量比较都证明了 DragGAN 在图像处理和点跟踪任务中优于先前方法的优势。
ControlNet: 控制扩散模型的魔法
从去年以来 AIGC 的技术不断冲击人们的想象力,针对图片的扩散模型(midjourney 和 stable diffusion)已经可以在给于 prompt 下生成非常吸引人的图像
HuggingGPT 强势来袭,LLM+ 专家模型,迈向更通用的 AI
HuggingFace + ChatGPT = HuggingGPT强势来袭。人类仿佛距离真正的AGI又更近了一步。
EfficientFormerV2 加速 ViT,更高效的移动端视觉模型
EfficientFormerV2 仿造卷积结构的MobileNet,对 transformers 进行一系列针对移动端加速的设计和优化。
5 分钟实现「视频检索」:基于内容理解,无需任何标签
在这篇文章中,我们将会使用 Milvus 和 Towhee 搭建一个基于内容理解的「视频检索」服务!