• 采购项目
  • 配套企业库
  • 销量查询
  • 盖世汽车社区
  • 盖世大学堂
  • 盖亚系统
  • 盖世汽车APP
  • 粤港澳大湾区智能汽车技术协同及采购对接会
  • 2026第九届智能驾驶大会
  • 2026第八届AI智能座舱大会
当前位置:首页 > 新技术 > 正文

宾夕法尼亚大学开发AI音频编辑器SmartDJ 只需简单指令即可重塑音频体验

盖世汽车 李新坤 2026-05-06 19:51:46 前瞻技术

盖世汽车讯 据外媒报道,宾夕法尼亚大学(University of Pennsylvania,Penn)的工程师开发出人工智能(AI)音频编辑器SmartDJ,用户只需使用日常语言的简单指令即可修改沉浸式音频环境,其潜在应用领域包括虚拟现实、增强现实、游戏和声音设计。SmartDJ无需用户指定具体的编辑内容,即可响应诸如“让这里听起来像繁忙的办公室”之类的高级指令,然后规划并执行实现该效果所需的步骤。

宾夕法尼亚大学开发AI音频编辑器SmartDJ 只需简单指令即可重塑音频体验

图片来源:WAVES Lab

该系统解决了早期AI音频编辑工具的两大局限性:首先,大多数先前的系统更适用于僵化的、模板式的命令,需要用户识别要添加或删除的声音;其次,这些工具通常处理的是单声道或“单轨”音频,失去了沉浸式音频体验所必需的空间线索。

相比之下,SmartDJ能够理解高级指令,并且专为立体声音频设计,因此能够进行编辑,从而更好地保留或重塑场景的空间结构。

更重要的是,该系统具有可解释性:用户可以看到SmartDJ执行的每一步操作。例如,如果用户输入“让这里听起来像繁忙的办公室”,SmartDJ可能会生成类似“在右侧添加3dB的电话铃声”这样的指令。用户可以修改、删除或添加单个步骤,从而更好地控制最终结果。

计算机与信息科学系(CIS)助理教授Mingmin Zhao表示:“使用SmartDJ,用户可以用自然语言描述他们想要的结果,系统会自动找出实现的方法。这证明AI可以帮助人们使用简单的语言以直观的方式编辑音频。”

语言模型与扩散模型的结合



本文共计1000字开通高级账号后继续阅读

登录后获取已开通的账号权益

本文共计1000字开通高级账号后继续阅读

您未开通,请开通后阅读

*特别声明:本文为技术类文章,禁止转载或大篇幅摘录!违规转载,法律必究。

本文地址:https://auto.gasgoo.com/news/202605/6I70456584C409.shtml

 
0

好文章,需要你的鼓励

微信扫一扫分享该文章