问:在AI世界,推土机「生产」哪家强?
新智元
共 1544字,需浏览 4分钟
· 2022-07-12
来源:学术头条
如果有人问你,「挖掘机技术哪家强?」
你大概率会想起这句知名广告词:「中国山东找蓝翔」。(不打广告,不打广告。)
那如果换个对象,换个问法,「在人工智能(AI)的世界里,哪一家的推土机更 cool?」
一个可能的答案是什么?
来,先斗一波图再说。
但事实上,它们在现实中的模板,只是下面这个普普通通的、「大黄蜂」颜色的推土机。
据介绍,他们可以利用人工智能技术将著名艺术品的风格融入任意 3D 场景中。
而且,相比于以往的研究,这一最新技术可以显示出更高质量的细节。
据论文描述,转换质量提高的原因是,研究团队的人工智能技术可以直接比较原始图像和新风格的 3D 场景之间的细节。而以往的人工智能技术,只是将图像特征转换为更紧凑的统计集进行分析,从而丢失了很多原始细节。
对此,论文作者之一 Kai Zhang 表示,「我们试图真正捕捉微妙的艺术风格,就像《星空》的笔触。这对人类的感知非常重要,因为我们的眼睛对局部细节非常敏感。」
在此次工作中,研究团队证明了基于最近邻特征匹配(NNFM)样式损失在捕捉风格细节方面非常有效,同时保持了多视图的一致性。
创造艺术形象通常需要大量的时间和特殊的专业知识,将艺术作品扩展到 2D 图像平面之外的维度,比如时间(在动画中)或 3D 空间(在雕塑或虚拟环境中),会面临很多限制和挑战。
研究团队表示,这一最新的风格转换技术(style transfer technique)未来有望用于动画电影和游戏行业中,用于手动微调前的风格模板。
此外,这一技术也同样适用于写实风格转换(photorealistic style transfers),比如将正午时的自由女神像转换为日落时的自由女神像。
而且,算法成功运算一次可能需要 20 分钟的时间。这是一个非常耗时的过程,因为在反复试验的过程中,人们可能会尝试不同的风格。
为此,研究团队在接下来的工作中将致力于提高内容生成的效率。
或许在未来的某一天,这一技术将用在人人都在使用的智能手机上。
参考资料:
https://arxiv.org/abs/2206.06360
https://www.cs.cornell.edu/projects/arf/
https://github.com/Kai-46/ARF-svox2
评论
AI论文写作工具和生成器(一)
随着人工智能和大模型的迅猛发展,AI对研究人员和学生提供了极大的写作便利。本文将介绍市面上常用的AI论文写作工具,帮助你提高论文写作效率并遵循学术道德。请仅将AI论文生成器视为辅助参考手段,切勿直接挪用全文。XPaper AlXPaper AI是由点击式创作工具晓语台推出的一款论文写作生成平台,只需
IQ前端
0
知乎高问:程序员有必要知道为什么做某个功能吗?
将Python客栈设为“星标⭐”第一时间收到最新资讯前言知乎上有一个提问:程序员有必要知道为什么做某个功能吗?↓↓↓今天,我们就这个话题一起来做个讨论。不知道程序员的你,在接到产品经理提的一个需求后,是习惯马上动手开始撸代码呢?还是会先暂停一下,认真思考一会如下一些问题,比如这个需求产生的背景是什么
Python客栈
0
奇域AI,最懂新中式美学的AI绘画神器
「奇域AI」是一款非常适合驾驭新中式审美的AI绘画工具。作为国内首个主打新中式插画的AI绘画产品,它提供了上百种新中式美学风格模型,包括新中式插画、笔墨水彩、新铅油画等,为用户提供了丰富的选择。这款工具在「网页版」和「小程序」上都可以使用,只需输入你想要的画面,就能生成出符合新中式审美的作品。奇域A
IQ前端
0
【第127期】推荐常用的国内外AI大模型
概述 多个国内外的AI大模型及其特点。以下是一些被提及的AI大模型和平台:全球大模型:ChatGPT:由OpenAI开发,支持多种语言,包括中文。Claude:由Anthropic开发,擅长深层次语言模式和复杂推理。Gemini:由Google Research开发,擅长自然语言理解和生成。Mis
前端微服务
0
Stability AI开放Stable Diffusion 3 API,在线免费使用
「Stability AI」宣布开放其最新文本到图像生成模型「Stable Diffusion 3」的API接口,供开发者和企业使用。该模型采用创新的多模态扩散转换器架构,在字体、细节还原、提示理解等方面表现优异,评测结果超越了业内其他顶尖系统。与DALL-E 3和Midjourney v6等最先进
IQ前端
0
【第126期】效地利用AI辅助编程并提高编程效率
概述 AI可以在编程的多个环节中提供帮助,从而显著提高编程效率。同时,也要注意AI工具的选择和使用,确保它们能够真正提升你的工作效率,而不是成为额外的负担。通过这些工具通过不同的方式辅助编程,包括代码生成、错误检测与修复、代码审查、自动化测试、性能优化等,旨在提高编程效率和代码质量。开发者可以根据
前端微服务
0
百问商业航天④|百亿农业遥感市场,机会在何方?
泰伯网【百问商业航天】是国内首档商业航天问答短视频栏目,拆解百个商业航天热议话题,汇聚百位产业创新者智识,以PUGC+AIGC铸造商业航天「创新者百科」。记录中国商业航天走向大时代的铿锵足音,为产业发展争取更大的话语权和影响力。本期问题:百亿农业遥感市场,机会在何方?揭榜嘉宾:戴维序 &n
泰伯网
0
AI智能视觉检测技术在工业级测量领域的创新应用--AMB Tube-Q导管数字化测量系统
技术背景在深度学习算法出来之前,对于视觉算法来说,大致可以分为以下5个步骤:特征感知,图像预处理,特征提取,特征筛选,推理预测与识别。早期的机器学习中,占优势的统计机器学习群体中,对特征是不大关心的。深度学习是机器学习技术的一个方面,由人工神经网络提供支持。深度学习技术的工作原理是教机器通过实例学习
机器视觉
0