一周AI最火论文 | 移动端的3D实时CNN正在成为现实,加速框架细节起底

大数据文摘

共 2966字,需浏览 6分钟

 · 2020-07-29

大数据文摘出品
作者:Christopher Dossman
编译:李雷、Luna、云舟

呜啦啦啦啦啦啦啦大家好,本周的AI Scholar Weekly栏目又和大家见面啦!
AI ScholarWeekly是AI领域的学术专栏,致力于为你带来最新潮、最全面、最深度的AI学术概览,一网打尽每周AI学术的前沿资讯。
每周更新,做AI科研,每周从这一篇开始就够啦!

本周关键词推荐系统、3D建模、BERT

本周最佳学术研究


新一代推荐系统实验工具

如果你关注推荐系统,那么python版的LensKit推荐系统引擎库(LKPY)可能会引起你的兴趣。这是一个开源工具包,可用于构建、研究及学习推荐系统。

2010年LensKit 的Java版本首次发布,目前该工具已经应用于各种研究的发表、小规模生产部署以及线上(MOOC)和线下(传统教室)教育中。

在本文中,美国博伊西州立大学的研究人员提出了LensKit for Python项目,将原始工具重新构建为灵活易用的Python插件,用于推荐系统研发。

Python版的LensKit(LKPY)使研究人员和学生能够利用强大且不断发展的PyData和Python科学生态圈(包括scikit-learn,TensorFlow和PyTorch),构建健壮、灵活且可重复的实验系统。

原文:

https://arxiv.org/pdf/1809.03125v3.pdf


Python的度量学习算法

Metric-learn是一个开源Python库,包含几种流行的有监督和弱监督度量学习算法的高效Python实现。

作为scikit-learn-contrib的一部分,metric-learn提供了一个与scikit-learn兼容的统一接口,可以很方便地与其他机器学习库进行交叉验证、模型选择和串联。Metric-learn遵从MIT许可,并已在PyPi上进行了全面测试。

github链接:
https://github.com/scikit-learn-contrib/metric-learn

原文:
https://arxiv.org/pdf/1908.04710v2.pdf

3D卷积神经网络的移动端加速框架

目前,许多移动终端都配备了强大的高端移动CPU和GPU,这使得它们逐步成为深度学习的重要平台。

本文介绍了RT3D,一种用于3D CNN(卷积神经网络)的移动端加速框架,它由两个新型且适用于移动设备的结构化稀疏方案(Vanilla和KGS)和最佳修剪算法组成,并且有一个编译器辅助的代码生成框架将对网络的修剪转化为性能的提升。

评测结果显示,RT3D击败了两个最先进的加速框架,加速高达29.1倍。这是RT3D首次在150 毫秒内预测16个视频帧,即通过纯软件解决方案在现成的移动设备上实现3D CNN的实时预测。

原文:
https://arxiv.org/abs/2007.09835v1

用于结构化3D建模的大型逼真数据集

研究人员创建了一个大型的Structured3D综合数据集,其中提供了21835个房间地面详细真实的3D结构批注,和超过196k的2D渲染。

他们引入了统一的“原始+关系”的表示方法,这使他们能够有效地捕获各种各样的半全局或全局的3D结构,及其相互关系。该数据集可用于训练深层网络以进行房间布局预测,并在公共基准上证明其性能得到改善,此数据集也可能有益于图像合成。

研究人员认为这项工作是构建智能机器重要且令人振奋的一步,该机器可以实现人类水平的整体3D场景理解。

他们将继续为数据集添加更多场景和对象的3D结构注释,并探索使用数据集的新方法,以推进用于结构化3D建模和理解的技术。

项目网站:

https://structured3d-dataset.org/


原文:
https://arxiv.org/pdf/1908.00222v3.pdf

使用BERT的会话系统生成产品标题

一组研究人员研究了在标签有限的情况下,为大型电子商务目录里的产品生成简明,语法正确的语音标题的问题。

在本文中,他们提出了一种使用BERT从输入Web标题生成简短、自然、口头化的标题序列到序列方法。即使在数据极其有限的情况下,他们仍通过指标和人工评估了4种不同的基准。

他们在现实世界的行业数据集上进行了广泛的实验,并对模型输出进行了人工评估,结果表明,BERT汇总优于可比较的基准模型。

基于丰富的用户元数据,来生成不同用户细分的个性化标题,并将Web数据与可能依赖于产品的其他产品属性结合在一起,是扩展此工作的一些方向。

原文:

https://arxiv.org/abs/2007.11768


其他爆款论文


用于R和Python的高维数据分析的稀疏学习库:毕加索项目:
https://arxiv.org/abs/2006.15261v1

自动单眼3D狗重建的端到端方法:谁把狗拒之门外?

https://arxiv.org/pdf/2007.11110v1.pdf


一种新的训练程序,可以减少3D检测任务所需的3D标签工作量:
https://arxiv.org/pdf/2004.02693v2.pdf

从单个2D偏振图像估计穿衣的人体形状的问题:

https://arxiv.org/pdf/2007.09268v1.pdf


学习资


深度学习:
https://lme.tf.fau.de/teaching/free-deep-learning-resources/

使用PyTorch进行深度学习:
https://mc.ai/top-5-free-resources-to-learn-deep-learning-with-pytorch/

65个最好的深度学习课程:
https://www.classcentral.com/subject/deep-learning

AI大事件


亚马逊为Alexa开发者推出了一系列新功能:
https://www.zdnet.com/article/amazons-new-tools-for-alexa-developers-hints-at-whats-next-for-the-voice-assistant/

人工智能降低了用户体验,但这一定是坏事吗?
https://www.zdnet.com/article/artificial-intelligence-drives-new-user-experiences/

专栏作者介绍

Christopher Dossman是Wonder Technologies的首席数据科学家,在北京生活5年。他是深度学习系统部署方面的专家,在开发新的AI产品方面拥有丰富的经验。除了卓越的工程经验,他还教授了1000名学生了解深度学习基础。

LinkedIn:

https://www.linkedin.com/in/christopherdossman/


志愿者介绍
后台回复志愿者”加入我们


点「在看」的人都变好看了哦!
浏览 31
点赞
评论
收藏
分享

手机扫一扫分享

举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

举报