免费观看已满十八岁电视剧国语_人妻 色综合网站_欧美大尺寸suv视频_成人免费高清在线观看_久久久成人毛片无码_老头解开奶罩吸奶头高潮视频_sm调教室论坛入口_欧美夫妻交换久久丫1000_一级黄色大片在线免费观看了

首頁 > 企業(yè)

百度深度語音識別推網(wǎng)頁應(yīng)用 速記之快令人類“顫栗”

2017/03/14 20:26      IT產(chǎn)業(yè)網(wǎng)


  速記行業(yè)正在迎來一場巨大變革,手指翻飛的速記員將與一款網(wǎng)頁應(yīng)用成為“同事”。近日,中國人工智能領(lǐng)導(dǎo)者百度宣布推出SwiftScribe網(wǎng)頁應(yīng)用,將改變完全依賴人工的速記行業(yè)現(xiàn)狀。該網(wǎng)頁應(yīng)用背靠百度深度語音識別系統(tǒng),將音頻文件轉(zhuǎn)為文本,轉(zhuǎn)化效率較人工速記快 1.67倍。

  百度首席科學家吳恩達認為這一應(yīng)用將改變采訪和視頻字幕生成,他在Facebook評論稱:“該應(yīng)用非常適合將長語音轉(zhuǎn)換為文本的人士,人工智能將實現(xiàn)1+1大于二的效果。”

1.jpg

  用戶可在PC端打開SwiftScribe網(wǎng)頁應(yīng)用,選取wav和mp3格式的文件上傳,系統(tǒng)就能馬上進行處理,時長1分鐘的音頻文件可以在30秒內(nèi)轉(zhuǎn)換完成。用戶可使用鍵盤快捷鍵就能進行加快播放、后退和添加換行符等操作,處理完成后,只需人工調(diào)整大小寫、標點及部分拼寫細節(jié)即可快捷、準確的完成音頻轉(zhuǎn)換。

  從使用效果看,SwiftScribe可為速記員帶來1.67倍的效率提升,縮短40%的工作時間。目前該系統(tǒng)可處理1小時內(nèi)的音頻文件,而這一時長正在開發(fā)團隊的努力下逐步延展,未來會增加視頻文件的語音識別及自動添加標點符號等功能,并支持更多文件格式,降低用戶使用門檻。

  此次推出的SwiftScribe網(wǎng)頁應(yīng)用,依托于百度新一代深度語音識別系統(tǒng)Deep Speech 2——曾被《麻省理工科技評論》評為“2016年十大突破技術(shù)”之一。通過利用長達數(shù)千小時的語音數(shù)據(jù)訓練,Deep Speech 2可以不斷“學習”從語音中識別特定的字或詞。MIT評論其:在識別漢語語音片段方面,要比人為識別更加準確。目前,百度語音識別準確率已達到97%,成為行業(yè)領(lǐng)先者。

  作為非英語母語者,百度SwiftScribe項目經(jīng)理吳田也曾深受長語音記錄的困擾“要整理一段1小時錄音對我來說要花上10個小時,” 而這也是這一應(yīng)用的靈感來源。百度在去年也推出了應(yīng)用DeepSpeech2的安卓輸入法TalkType,讓用戶能夠用語音快速輸入文字。百度硅谷人工智能實驗室項目領(lǐng)導(dǎo)人Bijit Halder在公告中稱:“TalkType是首款智能語音優(yōu)先輸入法。”

  對話機器將成為2017人工智能的發(fā)展風口,百度吳恩達曾在《華爾街日報》的采訪中表示,隨著準確率的提高和用戶體驗的提升,百度的語音產(chǎn)品已度過用戶心目中的“試用期”。在語音產(chǎn)品迅猛發(fā)展的大環(huán)境下,亞馬遜、蘋果、谷歌和微軟等科技巨頭都在加緊研發(fā)各自的語音識別技術(shù),然而在長文本音頻轉(zhuǎn)化技術(shù)上,百度仍然是行業(yè)最高水平的標桿。

  目前,百度SwiftScribe音頻轉(zhuǎn)換服務(wù)免費對外開放,但該應(yīng)用背后的商業(yè)前景不可小覷。據(jù)百度人士透露,未來希望能夠向商業(yè)化應(yīng)用轉(zhuǎn)變。

  榜單收錄、高管收錄、融資收錄、活動收錄可發(fā)送郵件至news#citmt.cn(把#換成@)。

海報生成中...

分享到微博

掃描二維碼分享到微信

分享到微信
一鍵復(fù)制
標題鏈接已成功復(fù)制

最新新聞

熱門新聞