新華網上海9月1日電(記者 蘭天鳴)在近日舉行的世界人工智能大會國際前沿算法峰會活動上,卡耐基梅隆大學計算機學院院長,《機器學習》作者湯姆·米切爾介紹了自己有關人工智能無監督學習的研究,他認為計算機是可以做到無監督學習的,并不斷提升水平。
湯姆·米切爾目前在卡耐基梅隆大學的研究組正在探索一個被稱為NELL(Nerver Ending Language Learner)的項目,旨在讓計算機 24 小時不停搜集網絡上的公開內容,并試圖標記出重要的信息,以此希望算法能夠不斷自我提升理解能力。
“當我們觀察這一項目時,可以發現在 NELL 當中有十個已標注的類型,而通過機器自動學習的未標注數據則超過 2500 萬個。” 湯姆·米切爾表示。“我們從傳統的單一函數學習框架擴展到了多函數的方法。今天,我們已經擁有 4000 余種分類方法,實現了前所未有的準確性。”
“今天的人工智能仍然大量依賴于人類專家的工作,但就像傳統工業最后會向自動化發展一樣”,香港科技大學教授楊強表示,數據孤島、小數據、用戶隱私的保護等導致數據的割裂,讓AI 技術很難發揮出價值。
他認為,在面臨數據割裂的情況下,需要讓幾種數據建立一個共享的模型,但在建立的過程中不交換數據,只是交換加密保護的模型參數。這種做法的效果就像是融合了多種數據的訓練,這就是聯邦學習。“聯邦遷移學習不僅提高了效率,也可以保護數據,讓各個企業的自有數據不出本地。對于銀行、電商、零售機構非常友好,讓他們的數據可以聚合,通過隱私保護的方法來實現更高程度的自動化。”
在楊強的愿景中,聯邦遷移學習最終的目的是形成一個生態,包括互聯網的數據,以及場景中的數據,不同行業和不同的用戶行為數據進行有機的結合。
據悉,本次國際前沿算法峰會由世界人工智能大會組委會主辦,第四范式、上海交通大學承辦。峰會以“算法定義AI未來”為主題,將向更底層的技術發問,求解能夠推動產業變革的未來算法,為人工智能產業往更縱深發展提出新思考。