让智能诞生听声辨位 西浦-南邮联队获海外大赛评委奖

让智能诞生听声辨位 西浦-南邮联队获海外大赛评委奖

声息是智能诞生感知外界的要津绪论之一,正确识别声息所处的环境关于栽植智能末端、机器东说念主及自动驾驶等边界的安全性和优化用户体验很有匡助。举例,助听器通过识别佩带者所处的环境,约略自动调动降噪和增强声息;自动驾驶车辆通过“凝听”周围环境的声息,不错援助系统作念出更准确的驾驶决策,提高行车安全。关系词,履行天下中的声息环境复杂多变,多种声息时时交汇在沿途,在传播经过中也会因环境和收罗诞生的不同而产生变化和失真。因此,在着实环境中涌现且高效地识别声息发生的场景仍是壅塞。

在本年举办的“海外声学场景和事件检测及分类挑战赛”(Detection and Classification of Acoustic Scenes and Events,以下简称“DCASE挑战赛”)上,西交利物浦大学和南京邮电大学的学者构成的联队针对这一壅塞张开了连络,他们蓄意了一款声学场景分类系统,于近日获取了声学场景分类赛说念的评委奖(Judges’ Award)。

西浦-南邮联队由西浦智能工程学院博士生蔡毅强、通讯工程专科大四学生林珉瑜,以及西浦智能科学系的李圣辰博士和南京邮电大学的邵曦博士两位携带敦厚构成。

左为李圣辰博士,右为蔡毅强。两东说念主在“DCASE挑战赛”授奖现场

据样貌进展东说念主蔡毅强先容,这次比赛条款参赛军队蓄意一款适用于袖珍镶嵌式诞生的声学场景分类系统,它需要监测、识别和分析听到的多样声息,并把柄音频特征自动辩别出声源所处的不同的场景,如街说念、公园、机场、地铁等。

蔡毅强暗意:“赛题有两个难点,一个是该分类系统需要被部署到耳机、麦克风、助听器等袖珍诞生中,这些诞生的内存和能耗有限,因此算法不行太大、太复杂。”

“另一个难点则在于大赛对系统锻真金不怕火样貌残酷了的新条款。现在,该类系统大多是基于深度学习模子的架构,锻真金不怕火经过中需要无数的东说念主工标签数据来告诉筹画机某个声息属于什么类别,再让它进行学习,这种样貌资本很高。是以,大赛条款所有参赛军队只可诈欺有限的标签数据进行锻真金不怕火,以减少东说念主力,提高算法锻真金不怕火效果。”

针对这两个难点,团队使用了自监督学习要领来锻真金不怕火系统,他们需要蓄意有用的自监督任务,让模子约略从音频数据中自动学习到有用的特征。“这种要领在音频边界的应用还相对较少,因为音频数据会随时辰变化,具有通顺性和时序性,且包含多种环境声和杂音问息,这加多了自监督学习任务蓄意的复杂性。”蔡毅强先容说念。

蔡毅强在办公室进行分类系统蓄意

“咱们使用了多个数据集,用无数不同的音频预锻真金不怕火了一个音频大模子,再在大赛提供的数据集上进行微调,栽植系统在大赛提供的音频数据中进行场景分类的准确度。”

“此时,诚然系统也曾不错进行场景分类,但由于较为复杂,并不妥当部署到袖珍诞生上。是以咱们调动地引入了‘常识蒸馏’这么一种模子压缩的要领,让这个大模子将其学到的常识升沉到一个低复杂度的模子中,在保证分类准确度的同期适配于袖珍诞生。”

携带敦厚李圣辰博士暗意:“主持方把柄各个军队提交系统的准确率进行排行,同期概括接头调动度以及代码质地等要素评比出唯独的评委奖。咱们团队的主要调动点在于自监督学习要领的调动应用,让系统无需东说念主工索求特征,即可输出声息场景的分类放胆。”

大赛授奖后主持方与参赛选手合影

在西浦读博之前,蔡毅强是西浦智能工程学院金融筹画专科的硕士毕业生,其时他就曾参与过几次DCASE挑战赛。诚然他的专科配景与音频边界并不精细关系,但在参赛经过中,蔡毅强对音频分类产生了浓厚的兴味,因此他礼聘在博士阶段络续深入连络这一边界。

蔡毅强暗意:“插足DCASE挑战赛让我有契机继续学习新常识、熟谙代码、不断团队,之前几次参赛资历也指点我走上了科研之路。通过比赛样貌,我不错探索未知的壅塞并尝试残酷科罚决议,并在实施中继续考证与优化我的想路,关于颓靡想考与批判性想维亦然一种提高;此外,与来自全天下的学者进行调换和交流拓宽了我的海外视线,也让我潜入体会到了科学连络的无国界魔力。”

据了解,DCASE挑战赛是音频信号处理边界的海外顶级赛事,旨在鼓吹音频信号处理和机器学习交叉学科连络。本年共有十七支军队参赛,他们分别来自清华大学、上海交通大学、西北工业大学、南边科技大学等国内高校,以及德国、法国、新加坡、澳大利亚等地的海外名校。

扬子晚报/紫牛新闻记者 顾秋萍 通讯员:金画恬 胡秋辰

校对 王菲



Powered by 银川涌暗伊商贸有限公司 @2013-2022 RSS地图 HTML地图

Copyright Powered by站群系统 © 2013-2024