[No.H100]
11月16日消息,據(jù)外媒報(bào)道,蘋果智能助手Siri的未來更新版本功能可能不再局限于語音識別,將來在與用戶對話時(shí),它可以啟動(dòng)蘋果設(shè)備中的FaceTime攝像頭,同時(shí)分析面部表情并解讀出情緒。
蘋果正在開發(fā)一種全新方法,通過在未來版本的Siri或其他系統(tǒng)中添加面部分析功能來幫助解釋用戶提出的請求。這樣做的目的是減少口頭請求被誤解的次數(shù),蘋果試圖通過分析用戶情緒來做到這一點(diǎn)。
蘋果在美國專利號20190348037的申請文件中說:“智能軟件代理可以代表用戶執(zhí)行操作,以響應(yīng)用戶使用自然語言的輸入,如用戶說出的句子。在某些情況下,智能軟件代理所采取的操作可能與用戶想要的操作不匹配。比如,視頻輸入中的面部圖像可以被分析,通過識別形狀或運(yùn)動(dòng)來識別特定的肌肉或肌肉群是否被激活。”
在這套系統(tǒng)中,需要使用面部識別技術(shù)來識別用戶身份,以便提供定制的操作,例如檢索該人的電子郵件或播放他們的個(gè)人音樂播放列表。
然而,它也意在解讀用戶的情緒狀態(tài)。專利文件中稱:“用戶反應(yīng)的信息被表示為一個(gè)或多個(gè)度量,例如用戶反應(yīng)對應(yīng)于某種特定狀態(tài)的概率,比如積極或消極情緒。”
在口頭指令可能被以不同方式解釋的情況下,這會(huì)有很大幫助。在這種情況下,Siri可能會(huì)計(jì)算出最可能的含義并對其進(jìn)行處理,然后使用面部識別功能來查看用戶是處于高興還是生氣狀態(tài)。
蘋果的這套系統(tǒng)“首先需要通過麥克風(fēng)獲得音頻輸入,并且通過攝像頭獲得一張或多張圖像”來發(fā)揮作用。蘋果注意到表情可以有不同的含義,但它的方法根據(jù)面部動(dòng)作編碼系統(tǒng)(FACS)對這些表情可能代表的含義進(jìn)行分類。
FACS是個(gè)面部情緒分類標(biāo)準(zhǔn),最早創(chuàng)建于20世紀(jì)70年代,它將每種可能的面部表情歸類到一個(gè)更廣泛的參考目錄中。使用FACS,蘋果的系統(tǒng)通過分析來確定哪種可能性最大,然后可以讓Siri做出相應(yīng)的反應(yīng)或回應(yīng)。
在蘋果列出的七位發(fā)明家中,只有一位擁有之前的專利,即杰里米·霍蘭德(Jerremy Holland),他也是蘋果2014年一項(xiàng)專利的唯一發(fā)明者,該專利涉及在媒體設(shè)備上同步視頻播放。然而,發(fā)明家尼古拉斯·阿波斯托洛夫(Nicholas E.Apostoloff)在使用機(jī)器學(xué)習(xí)技術(shù)分析和操作視頻方面的研究成果,也被整合到許多其他專利中。(騰訊科技審校/金鹿)
榜單收錄、高管收錄、融資收錄、活動(dòng)收錄可發(fā)送郵件至news#citmt.cn(把#換成@)。
海報(bào)生成中...