蘋果革命性創舉:用 AI 聆聽取代「嘿,Siri」喚醒
近期,《麻省理工科技評論》刊登了一篇題為「使用大型語言模型進行設備導向語音檢測的多模態方法」的研究報告,揭示了蘋果公司研究人員正在探索一種全新的方法,用以消除需要使用觸發短語如「嘿,Siri」的技術需求。這一舉措將使得與蘋果設備進行對話更加無縫化。
Siri AI 背景與目的
該研究著眼於利用人工智慧技術,通過聆聽用戶的語音及背景噪音,來檢測用戶何時與設備交談,並採取相應行動。
這意味著用戶無需再使用「嘿,Siri」等特定的喚醒詞語來啟動蘋果的虛擬助手。
Siri AI 研究方法及結果
在研究中,蘋果研究人員使用了智慧手機捕獲的語音數據以及背景噪音的聲學數據,訓練了一個大型語言模型。這個模型被設計用來辨識「可能表明用戶需要設備輔助」的模式。
Siri AI 論文亮點
- 模型基於 OpenAI 的 GPT-2 架構,輕量級且適合在智能手機等設備上運行。
- 使用超過 129 小時的數據進行模型訓練,但未公開訓練集的錄音來源。
- 透過結合聲學和詞彙特徵,以及法學碩士中的 ASR 解碼器訊號,探索了多模態系統。
Siri AI 研究成果與啟示
研究結果顯示,這一模型相較於純音訊或純文字模型,能夠做出更為準確的預測。
並且,隨著模型規模的擴大,其準確性將進一步提升,帶來更優異的表現。
Siri AI 隱私與擔憂
儘管這一技術帶來了便利,然而,史丹佛人類中心人工智慧研究所的隱私和資料政策研究員詹・金提出了一些擔憂。
他指出,取消「嘿,Siri」提示可能會加劇對設備「始終監聽」的擔憂,引發隱私問題。
蘋果公司的這項研究代表著對於智能助手技術的一大突破,為未來的交互式設備帶來了更多可能性。
然而,隨之而來的隱私問題仍需引起重視,相關單位需加強監管,確保用戶的個人訊息得到妥善保護。