当前位置：首页 > 新技术 > 正文

东京理科大学发明近似领域遗忘实现更安全、更可控的视觉语言模型

盖世汽车刘丽婷 2025-12-04 10:24:49

盖世汽车讯视觉语言模型（VLM）是现代人工智能（AI）的核心技术，可用于表示不同形式的表达或学习内容，例如照片、插图和草图。它具有很强的泛化能力，使其能够准确识别特定领域内图像中的物体。然而，这种泛化能力也存在风险。例如，VLM 可以将真实车辆和插图车辆都识别为“车辆”。

如果将这种模型应用于实际系统中，则存在将路边广告中的插图车辆误认为真实车辆，从而导致严重交通事故的风险。为了将安全可靠的人工智能应用于实际，必须建立能够根据应用场景适当控制学习知识的技术。

图片来源：东京理科大学

据外媒报道，针对这一问题，由日本东京理科大学（Tokyo University of Science）副教授Go Irie领导的研究团队提出了近似域遗忘（approximate domain unlearning，ADU）算法。该算法允许VLM“遗忘”特定域，使其无法识别这些域。例如，根据研究结果，该算法能够高精度地识别现实生活中的车辆。

这项创新性研究由东京理科大学的Kodai Kawamura和Yuta Goto、日本产业技术综合研究所（AIST）的Rintaro Yanagi博士以及AIST和牛津大学的Hirokatsu Kataoka博士共同撰写。该研究成果也已发表在arXiv预印本服务器上。

“人工智能技术长期以来一直致力于在所有领域内精确识别物体，这体现在数十年来对领域自适应和领域泛化的研究上，”Irie教授解释道。“虽然这种通用性仍然很重要，但具有卓越领域泛化能力的VLM的出现，让我们意识到这一假设本身值得重新审视。正是基于这种想法，我们构思了ADU——一种允许模型在必要时选择性遗忘特定领域的新方法。”

值得注意的是，技术难点在于VLM内部无法区分各个领域。由于不同领域在特征空间中存在重叠，因此很难仅选择并遗忘特定领域。

因此，本研究团队引入了一种名为域解耦损失（Domain Disentangling Loss）的方法，该方法能够促进特征空间中不同域之间的分离，并捕捉每幅图像中不同域的特征。

此外，通过引入实例提示生成器，所提出的算法在降低不必要域识别精度的同时，最大限度地减少了对这些域的需求。这使得人工智能能够灵活配置以适应各种实际场景，并实现以前无法实现的灵活知识控制，例如在保持功能性的同时，避免识别插图中的汽车。

有趣的是，ADU为风险管理引入了一个全新的视角。虽然人工智能风险管理的概念由来已久，但现代人工智能模型的泛化能力有时反而会带来新的风险。这项研究提出了一种构建人工智能的框架，该框架可以根据不同的使用场景进行灵活配置，从而确保安全性和适应性。

“随着人工智能性能的日益精进，为了促进可持续的工业应用，必须使其适应实际场景。我们相信，我们开发的这套系统能够让我们自由控制各项功能，从而为世界提供安全可靠的人工智能技术。”Irie教授总结道。