Transformers资料汇总!从原理到应用

小白学视觉

共 1831字,需浏览 4分钟

 · 2022-05-16

点击上方小白学视觉”,选择加"星标"或“置顶

重磅干货,第一时间送达

作者:Elvis,来源:AI公园

导读

从浅入深学习Transformer的资料汇总。


Transformers 加速了自然语言处理(NLP)任务的新技术和模型的发展。虽然它主要用于NLP任务,但现在它被大量应用于处理计算机视觉任务。这使它成为一个非常重要的技术。

我知道很多机器学习和NLP的学生和从业者都非常热衷于学习Transformers 。因此,我保存了一份资源和学习材料的配方,帮助学生了解Transformers的世界。

首先,在这篇文章中,我准备了一些材料链接,用于更好地从头开始理解和实现transformer模型。

写这篇文章的原因是这样我就可以有一个简单的方法来继续更新学习材料。

🧠 高层次介绍

首先,关于Transformers的非常高层次的介绍。一些值得一看的参考资料:

🔗 https://theaisummer.com/transformer/

🔗 https://hannes-stark.com/assets/transformer_survey.pdf

🎨 Transformer 图解

Jay Alammar)的解释很特别。一旦你对Transformer有了高层次的理解,你就可以跳到下面这个流行的关于Transformer的图解说明:

🔗 http://jalammar.github.io/illustrated-transformer/

🔖 技术汇总

此时,你可能正在寻找Transformers的技术摘要和概述。Lilian Weng的博文是一个宝藏,提供了简洁的技术解释/总结:

🔗 https://lilianweng.github.io/lil-log/2020/04/07/the-transformer-family.html

👩🏼‍💻 实现

理论之后,检验知识是很重要的。我通常喜欢更详细地理解事物,所以我更喜欢从头开始实现算法。对于实现Transformers,我主要依赖于这个教程:

🔗 https://nlp.seas.harvard.edu/2018/04/03/attention.html

📄 Attention Is All You Need

本文由Vaswani等人介绍了Transformer 的结构。在你有一个高层次的理解和想要进入细节后再读它。为了深入研究,请注意论文中的其他参考文献。

🔗 https://arxiv.org/pdf/1706.03762v5.pdf

👩🏼‍💻 应用 Transformers

在学习和理解Transformers背后的理论一段时间后,你可能会有兴趣将它们应用到不同的NLP项目或研究中。现在,你最好的选择是HuggingFace的Transformers库。

🔗 https://github.com/huggingface/transformers


END

英文原文:https://elvissaravia.substack.com/p/learn-about-transformers-a-recipe


下载1:OpenCV-Contrib扩展模块中文版教程
在「小白学视觉」公众号后台回复:扩展模块中文教程即可下载全网第一份OpenCV扩展模块教程中文版,涵盖扩展模块安装、SFM算法、立体视觉、目标跟踪、生物视觉、超分辨率处理等二十多章内容。

下载2:Python视觉实战项目52讲
小白学视觉公众号后台回复:Python视觉实战项目即可下载包括图像分割、口罩检测、车道线检测、车辆计数、添加眼线、车牌识别、字符识别、情绪检测、文本内容提取、面部识别等31个视觉实战项目,助力快速学校计算机视觉。

下载3:OpenCV实战项目20讲
小白学视觉公众号后台回复:OpenCV实战项目20讲即可下载含有20个基于OpenCV实现20个实战项目,实现OpenCV学习进阶。

交流群


欢迎加入公众号读者群一起和同行交流,目前有SLAM、三维视觉、传感器自动驾驶、计算摄影、检测、分割、识别、医学影像、GAN算法竞赛等微信群(以后会逐渐细分),请扫描下面微信号加群,备注:”昵称+学校/公司+研究方向“,例如:”张三 + 上海交大 + 视觉SLAM“。请按照格式备注,否则不予通过。添加成功后会根据研究方向邀请进入相关微信群。请勿在群内发送广告,否则会请出群,谢谢理解~



浏览 3
点赞
评论
收藏
分享

手机扫一扫分享

举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

举报