[No.H100]
國(guó)外媒體報(bào)道,基于語音助手的智能音箱在全世界越來越流行,數(shù)千萬消費(fèi)者使用智能音箱和他們的語音軟件來玩游戲,尋找熱門歌曲或查詢百科常識(shí)。但是,更多的消費(fèi)者不愿意邀請(qǐng)這些設(shè)備和他們強(qiáng)大的麥克風(fēng)到他們的家中,因?yàn)樗麄儞?dān)心有人可能在聽。
很多時(shí)候,的確是有人在“偷聽”。
據(jù)國(guó)外媒體報(bào)道,亞馬遜公司在世界各地雇傭了數(shù)千名員工,幫助改進(jìn)Alexa語音助手,為其Echo系列音箱系列提供動(dòng)力。
這個(gè)龐大的團(tuán)隊(duì)聆聽Echo業(yè)主的家中和辦公室捕捉到的錄音。這些錄音被轉(zhuǎn)錄、注釋,然后反饋到軟件中,亞馬遜這一團(tuán)隊(duì)的目的,是消除Alexa對(duì)人類語言理解的空白,并幫助它更好地響應(yīng)消費(fèi)者的語音命令。
根據(jù)七個(gè)參加過上述團(tuán)隊(duì)工作的人士透露,Alexa的語音審聽過程突出了在訓(xùn)練軟件算法中經(jīng)常被忽視的人類角色。
在營(yíng)銷材料中,亞馬遜表示,Alexa“生活在云中,而且總是變得越來越聰明。”但是就像許多軟件工具都是為了從經(jīng)驗(yàn)中學(xué)習(xí)而構(gòu)建一樣,人類也在給語音助手做一些教學(xué)工作。
知情人士稱,該團(tuán)隊(duì)由承包商和亞馬遜的全職員工組成,他們?cè)趶牟ㄊ款D到哥斯達(dá)黎加、印度和羅馬尼亞的分支機(jī)構(gòu)工作,他們簽署了保密協(xié)議,被禁止公開談?wù)撛擁?xiàng)目。
亞馬遜布加勒斯特分支機(jī)構(gòu)的兩名工作人員表示,他們每天工作9個(gè)小時(shí),每個(gè)審聽者每班分析多達(dá)1000個(gè)語音片段。亞馬遜布加勒斯特辦公室占據(jù)了羅馬尼亞首都新興的皮佩拉區(qū)Globalworth大樓的最高三層。在搖搖欲墜的基礎(chǔ)設(shè)施中,這座現(xiàn)代化的設(shè)施脫穎而出,大樓外部沒有任何亞馬遜標(biāo)志。
這項(xiàng)工作基本上是平淡無奇的。波士頓的一名工作人員說,他積累的語音資料包括像“泰勒·斯威夫特”(Taylor Swift)這樣的單一詞語,他會(huì)對(duì)這些數(shù)據(jù)進(jìn)行了注釋,以表明搜索者指的是一位音樂藝術(shù)家。
偶爾,審聽者也會(huì)聽到Echo用戶寧愿保持隱私的東西:比如說,一個(gè)在淋浴時(shí)唱著難聽歌曲的女人,或者是一個(gè)尖叫著求救的孩子。當(dāng)團(tuán)隊(duì)需要幫助解析一個(gè)混亂的單詞或遇到有趣的錄音時(shí),他們使用內(nèi)部聊天室來共享文件。
這些工作人員經(jīng)常會(huì)聽到令人沮喪的對(duì)話,甚至可能是犯罪過程的聲音。
其中兩名員工說,他們發(fā)現(xiàn)了一起他們認(rèn)為是性侵犯的事件。當(dāng)類似的事情發(fā)生時(shí),他們可能會(huì)在內(nèi)部聊天室里分享這些情況,以此作為緩解工作壓力的一種方式。
亞馬遜表示,當(dāng)員工聽到令人不快的事情時(shí),他們已經(jīng)制定了如何進(jìn)行處理的程序,但兩名駐羅馬尼亞的員工表示,在要求對(duì)此類案件進(jìn)行指導(dǎo)后,他們被告知,亞馬遜不會(huì)干預(yù)語音背后發(fā)生了什么。
亞馬遜的一位發(fā)言人在一份電子郵件聲明中表示:“我們認(rèn)真對(duì)待客戶個(gè)人信息的安全和隱私。為了改善客戶體驗(yàn),我們只對(duì)極小的Alexa錄音樣本進(jìn)行了注釋。例如,這些信息可以幫助我們培訓(xùn)語音識(shí)別和自然語言理解系統(tǒng),這樣Alexa就可以更好地理解您的請(qǐng)求,并確保該服務(wù)能夠很好地為每個(gè)人工作。
“我們有嚴(yán)格的技術(shù)和業(yè)務(wù)保障措施,對(duì)濫用我們的制度采取零容忍政策。在工作流程中,員工無法直接訪問某位用戶或帳戶的信息。所有信息都是高度保密的,我們使用多因素身份驗(yàn)證來限制訪問、服務(wù)加密和檢查我們的控制環(huán)境,以保護(hù)用戶隱私。”
亞馬遜在其營(yíng)銷和隱私政策材料中沒有明確表示,人類員工正在收聽Alexa收集的一些對(duì)話的錄音。“我們利用你對(duì)Alexa的要求來訓(xùn)練我們的語音識(shí)別和自然語言理解系統(tǒng),”該公司在一份常見問題列表中說。
在Alexa的隱私設(shè)置中,該公司為用戶提供了在開發(fā)新功能時(shí)禁用其錄音的選項(xiàng)。彭博社查看的一張屏幕截圖顯示,發(fā)送給Alexa審聽人員的錄音沒有提供用戶的全名和地址,但是與某位智能音箱用戶的賬號(hào)、用戶的名字和設(shè)備的序列號(hào)相關(guān)聯(lián)。
今年早些時(shí)候,美國(guó)媒體《The Intercept》報(bào)道稱,亞馬遜旗下子公司RING的員工在該公司門鈴攝像頭拍攝的視頻中手動(dòng)識(shí)別車輛和人員,以期更好地訓(xùn)練該軟件自己完成這項(xiàng)工作。
美國(guó)密歇根大學(xué)(University Of Michigan)教授弗洛里安·朔布(Florian Schaub)研究了智能音箱的隱私問題,他說:“你不一定會(huì)想到另一個(gè)人在興致濃厚地傾聽你說的話。我認(rèn)為我們已經(jīng)習(xí)慣于這樣的假設(shè),即這些機(jī)器只是在做神奇的機(jī)器學(xué)習(xí)。但事實(shí)是,仍然需要人類員工處理。”
他補(bǔ)充說:“這是否涉及隱私問題,取決于亞馬遜和其他公司對(duì)他們手工注釋的信息類型有多謹(jǐn)慎,以及他們?nèi)绾蜗蚱渌苏故具@些信息。”
2014年Echo智能音箱首次亮相之后,亞馬遜的發(fā)明推動(dòng)了語音軟件在家庭環(huán)境中的使用。
不久之后,谷歌公司它推出了自己版本的智能音箱,名為Google Home,隨后蘋果公司也推出了自家的的HomePod。
在中國(guó)市場(chǎng),也有許多公司開始銷售智能音箱�?萍际袌�(chǎng)研究公司Canalys的數(shù)據(jù)顯示,去年全球消費(fèi)者購(gòu)買了7800萬臺(tái)智能音箱。數(shù)以百萬計(jì)的人使用語音軟件與智能手機(jī)上的語音助手進(jìn)行交互。
Alexa軟件設(shè)計(jì)用于連續(xù)錄制音頻片段,收聽喚醒詞,默認(rèn)情況下是“Alexa”,但人們可以將其更改為“Echo”或“Computer”。當(dāng)檢測(cè)到喚醒字時(shí),智能音箱頂部的光環(huán)變?yōu)樗{(lán)色,表明設(shè)備正在記錄并向亞馬遜的網(wǎng)絡(luò)服務(wù)器發(fā)送命令。
大多數(shù)現(xiàn)代語音識(shí)別系統(tǒng)都依賴于模仿人腦的神經(jīng)網(wǎng)絡(luò)。軟件通過在大量數(shù)據(jù)中發(fā)現(xiàn)規(guī)律和模式,從而一邊工作一邊學(xué)習(xí)。
為Echo和其他智能音箱提供動(dòng)力的算法使用概率模型進(jìn)行有根據(jù)的猜測(cè)。如果有人問Alexa附近有沒有希臘餐館,算法知道用戶可能是在找餐館,而不是教堂或社區(qū)中心。
但有時(shí)Alexa也會(huì)弄錯(cuò)——尤其是在處理新的俚語、地區(qū)口語或英語以外的其他語言時(shí)。在法語中,avec sa,“和他在一起”或者“和她在一起”等表達(dá)方式可能會(huì)把軟件搞糊涂,以為有人在使用Alexa的喚醒詞。
另外,Hecho在西班牙語中代表事實(shí)或行為,有時(shí)被誤解為Echo。諸如此類,這就是亞馬遜招募人工助手來彌補(bǔ)算法不足的原因。
蘋果的Siri也有人工助手,他們負(fù)責(zé)判斷語音助手對(duì)請(qǐng)求的解釋是否與該人所說的一致。根據(jù)蘋果的一份安全白皮書,他們審查的錄音片段沒有個(gè)人身份信息,并與一個(gè)隨機(jī)標(biāo)識(shí)符捆綁存儲(chǔ)六個(gè)月。在此之后,數(shù)據(jù)將從其隨機(jī)標(biāo)識(shí)信息中去除,但可能會(huì)被存儲(chǔ)更長(zhǎng)時(shí)間,以提高Siri的語音識(shí)別能力。
該公司表示,在谷歌,一些審聽者可以從“谷歌助手”那里獲取一些音頻片段,以幫助培訓(xùn)和改進(jìn)產(chǎn)品,但它與任何個(gè)人身份信息都沒有關(guān)聯(lián),音頻也進(jìn)行了修改。
亞馬遜公司最近發(fā)布了一篇招聘布加勒斯特“Alexa數(shù)據(jù)服務(wù)公司”(Alexa Data Services)質(zhì)量保證經(jīng)理的啟事,招聘啟事中描述了人類員工扮演的角色:“Alexa每天傾聽成千上萬的人跟她談?wù)摬煌闹黝}和不同的語言,她需要我們的幫助來理解這一切。”招聘廣告繼續(xù)說:“這是你從未見過的大數(shù)據(jù)處理。我們每天都在創(chuàng)造、標(biāo)記、策劃和分析大量的講話。”
據(jù)一位熟悉該工作流程的人士透露,亞馬遜對(duì)語音數(shù)據(jù)的審查過程始于Alexa隨機(jī)抽取一小部分用戶的錄音,并將這些音頻文件發(fā)送給遠(yuǎn)方的員工和承包商。
一些Alexa審聽者的任務(wù)是轉(zhuǎn)錄用戶的命令,將錄音與Alexa的自動(dòng)轉(zhuǎn)錄文本進(jìn)行比較,或者注釋用戶和機(jī)器之間的交互。那個(gè)人問了什么?Alexa提供了有效的答復(fù)了嗎?
其他人會(huì)記下他們聽到的每一句話,包括背景對(duì)話——即使是在孩子說話的時(shí)候。有時(shí),審聽人會(huì)聽到用戶討論諸如姓名或銀行詳細(xì)信息之類的私人細(xì)節(jié),在這種情況下,他們應(yīng)該在一個(gè)表示“關(guān)鍵數(shù)據(jù)”的對(duì)話框中打勾。然后轉(zhuǎn)到下一個(gè)音頻文件。
根據(jù)亞馬遜的網(wǎng)站,除非Echo檢測(cè)到喚醒詞或按下按鈕激活,否則音頻不會(huì)被存儲(chǔ)。但有時(shí),Alexa似乎開始錄制聲音,沒有任何提示,一個(gè)聽不懂的噪音意味著音頻文件已經(jīng)開始錄制。
無論激活是否錯(cuò)誤,審聽人都必須對(duì)語音內(nèi)容進(jìn)行轉(zhuǎn)錄。一位知情人士說,當(dāng)Alexa沒有收到喚醒指令或被意外觸發(fā)時(shí),審聽人每天記錄多達(dá)100段錄音。
據(jù)兩位亞馬遜審聽人說,在世界各地的家庭中,Echo智能音箱的用戶經(jīng)常猜測(cè)誰可能在聽,“你為美國(guó)國(guó)安局工作嗎”他們還問:“Alexa,有人在聽我們說話嗎?”(騰訊科技審校/承曦)
榜單收錄、高管收錄、融資收錄、活動(dòng)收錄可發(fā)送郵件至news#citmt.cn(把#換成@)。
海報(bào)生成中...