Transformer稀疏模型：将文本、图像、声音一网打尽

七月在线实验室

共 1268字，需浏览 3分钟

· 2021-03-14

Transformer是一种强大的序列模型，但是它所需的时间和内存会随着序列长度出现二阶增长。而OpenAI研究人员开发出了一种深度神经网络Sparse Transformer，该网络在预测长序列方面创造了新纪录——无论预测的是文本、图像还是声音。该神经网络利用注意力机制中的一种改进算法，可以从长度可能是之前30倍的序列中提取模式。

OpenAI提出的模型可以使用数百个层对数万个元素的序列进行建模，在多个域中实现最先进的性能。稀疏Transformer能够帮助我们构建具有更强的理解世界能力的AI系统。

Sparese Transformer 项目说明文档

一、项目介绍

Transformer 中 Self-attention的计算时间和显存占用量都是的（表示序列长度），随着序列长度的增加，计算时间和显存占用也都成二次方增长。因此当序列长度足够大时，计算时间和显存带来的问题也会很大。Sparse Transformer 引入了注意力矩阵的稀疏分解将计算时间和显存占用减小至，同时不会降低性能。

项目所需环境：

项目目录：

二、数据集介绍

三、算法原理

Sparse Transformer 主要介绍了strided attention和fixed attention，并与full attention进行了对比，结构如下：

四、数据训练测试

训练结果如下：

回顾精品内容

推荐系统

1、干货 | 基于用户的协同过滤推荐算法原理和实现

2、超详细丨推荐系统架构与算法流程详解

3、推荐：一文从0到1掌握用户画像知识体系

机器学习

1、从小白到大师：一文Get决策树的分类与回归分析

自然语言处理(NLP)

1、AI自动评审论文，CMU这个工具可行吗？我们用它评审了下Transformer论文

2、Transformer强势闯入CV界秒杀CNN，靠的到底是什么"基因"

计算机视觉(CV)

1、9个小技巧让您的PyTorch模型训练装上“涡轮增压”...

GitHub开源项目：

1、火爆GitHub！3.6k Star,中文版可视化神器现身

2、两次霸榜GitHub！这个神器不写代码也可以完成AI算法训练

3、登顶GitHub大热项目 | 非监督GAN算法U-GAT-IT大幅改进图像转换

每周推荐：

1、本周优秀开源项目分享：无脑套用格式、开源模板最高10万赞

2、本周优秀开源项目分享：YOLOv4的Pytorch存储库、用pytorch增强图像数据等7大项目

七月在线学员面经分享：

1、双非应届生拿下大厂NLP岗40万offer：面试经验与路线图分享

2、转行NLP拿下40万offer：分享我面试中遇到的54道面试题(含参考答案)

3、NLP面试干货分享：从自考本科在职硕士到BAT年薪80万

浏览 52

点赞

收藏

分享

举报

评论

图片

表情

txt2img将文本替换成图像

txt2img将一个元素中的文本替换成与该文本对应的图像。

txt2img将文本替换成图像

【NLP】使用Transformer模型进行文本分类

机器学习初学者

解析Transformer模型

yolov5模型修剪/稀疏性

pytorch玩转深度学习

Transformer又一城 | Swin-Unet：首个纯Transformer的医学图像分割模型解读

AI人工智能初学者

基于transformer的文本识别方法

很久很久很久之前（大约是两年前）接触到了Transformer，seq2seq模型注意力机制的另一种实现，完全摒弃了循环网络，使得速度得到极大提升。所以就忍不住想，把Transformer应用到文本识别上来是否可行呢？这一想法使得我几天几夜茶饭不思，夜不能眠，理论上肯定是可以的，因为Transformer也是用于seq2seq模型的；鉴于最近终于空闲了，可以放手实现一下。关于Transformer的理论细节，本文就不展开了（后面计划着...）。其结构如下图所示：而我们主要关注的是encoder部分：基于TRANSFORMER文本识别模型的网络架构参考文献[3]把识别模型网络结构划分成了四部分，如图：

RWKV-LM线性 Transformer 模型

RWKV是结合了RNN和Transformer的语言模型，适合长文本，运行速度较快，拟合性能较好，占用显存较少，训练用时较少。RWKV整体结构依然采用TransformerBlock的思路，其整体结构

RWKV-LM线性 Transformer 模型

预训练图像处理Transformer

点击上方“小白学视觉”，选择加"星标"或“置顶”重磅干货，第一时间送达作为自然语言处理领域的主流模型，Transformer 近期频频出现在计算机视觉领域的研究中。例如 OpenAI 的 iGPT、Facebook 提出的 DETR 等，这些跨界...

小白学视觉

手把手带你Transformer图像分类

预训练图像处理Transformer

新机器视觉

点赞

收藏

分享

举报