采购项目

作为采购商，我可以：

在线发布采购项目，招募精准供应商
3个工作日后，获取由盖世汽车整理的供应商清单

作为供应商，我可以：

获取配套商机，在线申请采购项目
完善公司资料，让采购商深入了解我的生产能力

去看看 >
配套企业库
销量查询
盖世汽车社区
盖世大学堂
盖亚系统
盖世汽车APP

寻求
报道
公众号
扫码关注
为你推送最新、最有料的汽车行业资讯新闻
1. 盖世汽车社区
2. 盖世汽车每日速递
APP
汽车从业人员必备工具
7*24小时专业陪伴，助力职业成长
扫码下载APP 即刻体验
企业库
销量
查询
采购
项目
用户
反馈

当前位置：首页 > 国际 > 正文

研究发现新人工智能方法可从图像中绘制场景

盖世汽车刘丽婷 2023-06-28 17:28:29

盖世汽车讯生成式人工智能程序可以根据文本提示生成图像。这些模型在生成单个对象的图像时效果最佳。但创建完整的场景仍然很困难。据外媒报道，荷兰特文特大学（University of Twente，UT）研究院、荷兰地理资讯科学与地球观察学院（Geo-Information Science and Earth Observation）场景理解小组（Scene Understanding Group）助理教授Michael Ying Yang近日开发出新方法，可以绘制图像中的场景，以生成逼真且连贯的图像。相关研究已发表于期刊《IEEE Transactions on Pattern Analysis and Machine Intelligence》。

研究发现新人工智能方法可从图像中绘制场景

图片来源：荷兰特文特大学

人类非常擅长定义对象之间的关系。Yang解释说：“我们可以看到一张椅子站在地板上，一只狗在街上行走。但人工智能模型却很难。”提高计算机检测和理解视觉关系的能力是图像生成所必需的，同时也可以帮助自动驾驶车辆和机器人更好地感知。

从两阶段到单阶段

目前已有用于绘制图像语义理解的方法，但其速度很慢。这些方法使用两阶段方法（two-stage approach）：首先映射场景中的所有对象；然后特定的神经网络遍历所有可能的连接，并用正确的关系标记。

此方法必须经历的连接数量会随着对象数量呈指数增长。Yang表示：“我们的模型只需一步，即可同时自动预测主体、物体及其关系。”

检测关系

对于这种单阶段方法，模型会查看场景中对象的视觉特征，并重点关注最相关的细节来确定关系。它突出显示了对象相互作用或相互关联的重要领域。这些技术和相对较少的训练数据足以识别不同对象之间最重要的关系。最后，生成对连接的描述。

Yang表示：“该模型检测到，在示例图片中，该男子很可能与棒球棒互动。然后，它被训练来描述最可能的关系：‘人-挥杆-棒球棒’。”

*版权声明：本文为盖世汽车原创文章，如欲转载请遵守转载说明相关规定。违反转载说明者，盖世汽车将依法追究其法律责任!

本文地址：https://auto.gasgoo.com/news/202306/28I70347204C101.shtml

文章标签：前瞻技术

0

好文章，需要你的鼓励

小智一周要闻 | 首批河南造人形机器人下线

24小时热文

联系我们

联系邮箱：info@gasgoo.com
求职应聘：021-39197800-8035
简历投递：zhaopin@gasgoo.com
客服微信：gasgoo12 (豆豆)
合作电话

新闻热线：021-39586122
商务合作：021-39586681
市场合作：021-39197800-8032
研究院项目咨询：021-39197921
站内导航

盖世汽车社区盖世大学堂-公开课英文资讯站热门内容数据报告盖世汽车产业大数据
关于盖世
盖世汽车APP下载

增值电信业务经营许可证沪B2-2007118 沪ICP备07023350号沪公网安备 31011402009699号版权所有2011|未经授权禁止复制或建立镜像，否则将追究法律责任。