[No.S015-2]
近日,“智源 — MagicSpeechNet 家庭場景中文語音數(shù)據(jù)集挑戰(zhàn)賽”正式落下帷幕。該比賽由北京智源人工智能研究院主辦,biendata人工智能競賽平臺承辦,北京愛數(shù)智慧科技有限公司協(xié)辦,吸引了140多名來自學術界和產(chǎn)業(yè)界的研究者和從業(yè)者參加。經(jīng)過3個多月的激烈角逐,來自華南理工大學、深圳大學、中國科學院自動化研究所、斗魚直播、網(wǎng)易、小米等學校和企業(yè)的隊伍進入復賽并取得較好成績。
舉辦比賽被認為是解決具體問題的重要方式。隨著智能語音技術的成熟,該領域的比賽也在逐漸增多,比較知名的有對話類識別比賽CHiME、語音合成比賽Blizzard、說話人識別比賽NIST等。但目前來看,對話類識別的賽事較少,以中文對話為語料的比賽則更少。因此,該賽事自開賽起就備受關注。
主辦方智源研究院是北京人工智能領域優(yōu)勢單位共建的新型研發(fā)機構(gòu),為研究者們勇闖人工智能科技前沿“無人區(qū)”,推動人工智能理論、方法等取得變革性、顛覆性突破提供平臺。賽事數(shù)據(jù)由知名AI數(shù)據(jù)服務商愛數(shù)智慧提供,為反應真實家庭環(huán)境下的混響,該數(shù)據(jù)在不同結(jié)構(gòu)和家裝材料的房間進行錄制。比賽過程中,主辦方還邀請了中科院研究人員進行了2次賽題思路分享,為參賽選手提供指導。
語音識別一直被視為人工智能和機器學習的難題之一,因為說話人、環(huán)境、設備都會影響識別效果。而在對話類語音識別中,上下文、對話目的等因素的影響,進一步提高了識別的難度。“比賽結(jié)果超出了我們的預期,面對這些不確定因素,參賽者們發(fā)現(xiàn)并驗證了一些新方法,提高了模型的性能。比如有選手創(chuàng)造性地將多個通道的數(shù)據(jù)融合起來訓練模型,大大提高了識別的準確率。”在接受采訪時,主辦方人員如是說。
近年來,中國人工智能技術研發(fā)和商業(yè)化發(fā)展取得了令人矚目的成果,國際上也有了更多的“中國聲音”。這些成果離不開人工智能研發(fā)人員和從業(yè)者的努力。這是智源研究院舉辦的第一屆對話類語音識別挑戰(zhàn)賽。愛數(shù)智慧在初賽中提供的訓練集是經(jīng)過LDC(知名的數(shù)據(jù)存儲與發(fā)放平臺)認證的數(shù)據(jù),保證了比賽的數(shù)據(jù)品質(zhì)。智源研究院舉辦的系列比賽也將變成集眾智的平臺,為人工智能從業(yè)者提供更多探索科技前沿的機會。
榜單收錄、高管收錄、融資收錄、活動收錄可發(fā)送郵件至news#citmt.cn(把#換成@)。
海報生成中...