盖世汽车讯 视觉语言模型(VLM)是现代人工智能(AI)的核心技术,可用于表示不同形式的表达或学习内容,例如照片、插图和草图。它具有很强的泛化能力,使其能够准确识别特定领域内图像中的物体。然而,这种泛化能力也存在风险。例如,VLM 可以将真实车辆和插图车辆都识别为“车辆”。
如果将这种模型应用于实际系统中,则存在将路边广告中的插图车辆误认为真实车辆,从而导致严重交通事故的风险。为了将安全可靠的人工智能应用于实际,必须建立能够根据应用场景适当控制学习知识的技术。
图片来源: 东京理科大学
*特别声明:本文为技术类文章,禁止转载或大篇幅摘录!违规转载,法律必究。
本文地址:https://auto.gasgoo.com/news/202512/4I70438353C409.shtml
 
联系邮箱:info@gasgoo.com
求职应聘:021-39197800-8035
简历投递:zhaopin@gasgoo.com
客服微信:gasgoo12 (豆豆)
新闻热线:021-39586122
商务合作:021-39586681
市场合作:021-39197800-8032
研究院项目咨询:021-39197921
