点击上方“CVer”,选择加"星标"置顶
重磅干货,第一时间送达
文本提示:穿着芭蕾舞短裙的萝卜宝宝在遛狗。
文本提示:一只X射线的猫头鹰:
文本提示:孔雀橡皮。
文本+图像提示:参照上面的猫在下面生成草图
OpenAI祭出120亿参数魔法模型!从文本合成图像栩栩如生,仿佛拥有人类的语言想象力
1
引言
2
方法
q_φ表示在给定RGB图像x2的情况下,由DVAE编码器生成的32×32图像token上的分布 p_θ表示由DVAE解码器在给定图像token的情况下生成的RGB图像上的分布 p_ψ表示文本和图像token在transformer建模中得到的联合分布。
数据收集
3
结论
点击下方卡片并关注,了解CV最新动态
CV资源下载
后台回复:CVPR2020,即可下载代码开源的论文合集
后台回复:ECCV2020,即可下载代码开源的论文合集
后台回复:YOLO,即可下载YOLOv4论文和代码
后台回复:Transformer综述,即可下载两个最新的视觉Transformer综述PDF,肝起来!
重磅!CVer-细分垂直交流群成立
扫码添加CVer助手,可申请加入CVer-细分垂直方向 微信交流群,也可申请加入CVer大群,细分方向已涵盖:目标检测、图像分割、目标跟踪、人脸检测&识别、OCR、姿态估计、超分辨率、SLAM、医疗影像、Re-ID、GAN、NAS、深度估计、自动驾驶、强化学习、车道线检测、模型剪枝&压缩、去噪、去雾、去雨、风格迁移、遥感图像、行为识别、视频理解、图像融合、图像检索、论文投稿&交流、Transformer、PyTorch和TensorFlow等群。
一定要备注:研究方向+地点+学校/公司+昵称(如目标检测+上海+上交+卡卡),根据格式备注,才能通过且邀请进群
▲长按加微信群
▲点击上方卡片,关注CVer公众号
整理不易,请给CVer点赞和在看!