Transformer_Transformer技术文章_InfoQ写作社区

全部标签 



写点什么

登录注册

Transformer

0 人感兴趣 · 14 次引用

关注

最新
推荐

https://static001.geekbang.org/infoq/cf/cfa8a99e91ce6244e4ff9ded0f6762c5.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

ChatGPT 最好的替代品

02-17

前两天我们邀请了微软工程师为我们揭秘 ChatGPT，直播期间有个读者问到：有了 ChatGPT，BERT 未来还有发展前途吗？我想起来最近读过的一篇博客“最好的 ChatGPT 替代品”。

机器学习 Transformer BERT ChatGPT

https://static001.geekbang.org/infoq/32/3256b0d0a63bdbf3e85a4dd26435d158.jpeg?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

SVFormer：走进半监督动作识别的视觉 Transformer

02-17

SVFormer 用ViT进行半监督动作识别

计算机视觉 Transformer

https://static001.geekbang.org/infoq/0a/0a943cbafdbf6279e68fb96a1288ebc6.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

Transformer：让 ChatGPT 站在肩膀上的巨人？

2022-12-19

编者按：ChatGPT以近乎狂热之势席卷了全网。在沉浸于“ChatGPT潮”的同时，让我们也来深入了解一下它和基石技术 - 大模型 Transformer吧。

https://static001.geekbang.org/infoq/96/963cfb959199cd8d57326ae1300ca414.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

人工智能自然语言处理之 Transformer 阐述

2022-11-14

输入单词首先编码成词向量a（Input Embedding），然后直接和该单词在语句中的位置编码向量b（Positional Encoding）相加得到c。 c向量输入到一个Muti-Head Attention + Add & Norm + Feed Forward + Add & Norm的Block中得到向量d，d再输入到Nx Block中。

人工智能自然语言处理 Transformer 11月月更

https://static001.geekbang.org/infoq/4e/4e80b5951c9fe6b2b95e7337e4cdc4fb.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

2022 全球 AI 模型周报

2022-08-19

本周介绍了 5 个多模态的深度学习模型：CLIP 连接文本与图像、 BLIP 统一图文理解与生成、 LightningDot 加速图文跨模态检索、 Data2Vec 兼容文本与音频、 Perceiver 进一步模拟人类处理不同模态数据。

深度学习计算机视觉 Transformer 多模态

阿里云机器学习平台 PAI 与华东师范大学论文入选 SIGIR 2022

阿里云大数据AI技术

2022-07-11

论文主导通过引入稀疏自注意力的方式来提高Transformer模型处理长序列的效率和性能

Transformer 机器学习/深度学习

https://static001.geekbang.org/infoq/de/de2cd3c9d4a744b4c0bc3ce1c4d928ac.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

CVPR2022 | 上科大 x 小红书首次提出动作序列验证任务，可应用于体育赛事打分等多场景

小红书技术REDtech

2022-06-21

在CVPR2022上，上海科技大学和小红书多模态算法团队共同提出了一项新颖的动作序列验证任务，此方法能够用于娱乐/体育领域的自动打分，并有助于更精准地为用户推荐相关笔记。

Transformer CVPR2022 视频动作理解动作序列验证

https://static001.geekbang.org/infoq/38/389309f5cf14a8105250091ea8bdc35e.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

CVPR2022 ｜小红书首创多图交互建模挑战热门研究课题，大幅提升行人重识别性能

小红书技术REDtech

2022-06-13

在CVPR2022上，小红书多模态算法组提出一种新颖的用于行人重识别的网络NFormer，对多张输入图像进行交互式建模以获得更好的特征表达。

Transformer CVPR2022 行人重识别

https://static001.geekbang.org/infoq/7e/7e07c4640698c63332077d5394c68edf.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

恒源云 (Gpushare)_Restormer: 用于高分辨率图像重建的高效 Transformer

2022-05-07

文章来源 | 恒源云社区

人工智能深度学习 Transformer

espnet 中的 transformer 和 LSTM 语言模型对比实验

华为云开发者联盟

2022-03-30

本文以aishell为例，通过对比实验为大家介绍transformer和LSTM语言模型。

nlp Transformer espnet LSTM语言模型 aishell

带你读 AI 论文丨用于细粒度分类的 Transformer 结构—TransFG

华为云开发者联盟

2021-09-11

摘要：本文解读了《TransFG: A Transformer Architecture forFine-grained Recognition》，该论文针对细粒度分类任务，提出了对应的TransFG。

细粒度映射 Transformer TransFG 差异性图片

带你读 AI 论文：基于 Transformer 的直线段检测

华为云开发者联盟

2021-08-10

摘要：本文提出了一种基于Transformer的端到端的线段检测模型。采用多尺度的Encoder/Decoder算法，可以得到比较准确的线端点坐标。作者直接用预测的线段端点和Ground truth的端点的距离作为目标函数，可以更好的对线段端点坐标进行回归。

模型目标检测 Transformer 线段检测 LETR

https://static001.geekbang.org/infoq/19/191e74ac2f4b4ac3bcfd93517673690c.jpeg?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

This post is all you need（①多头注意力机制原理）

2021-07-07

各位朋友大家好，欢迎来到月来客栈。今天要和大家介绍的一篇论文是谷歌2017年所发表的一篇论文，名字叫做”Attention is all you need“[1]。当然，网上已经有了大量的关于这篇论文的解析，不过好菜不怕晚笔者只是在这里谈谈自己对于它的理解以及运用。对于这

深度学习 Transformer

AI 论文解读：基于 Transformer 的多目标跟踪方法 TrackFormer

华为云开发者联盟

2021-06-28

摘要：多目标跟踪这个具有挑战性的任务需要同时完成跟踪目标的初始化、定位并构建时空上的跟踪轨迹。本文将这个任务构建为一个帧到帧的集合预测问题，并提出了一个基于transformer的端到端的多目标跟踪方法TrackFormer。

预测 Transformer 多目标跟踪 TrackFormer 跟踪目标

1

玩转社区

Q&A

优质合集

精选文章

企业号社区

行业技术资讯

三周年

征文活动