蘋果 AI 人工智慧革新!開源四款模型掀起技術革命
蘋果公司宣布了四款開源模型,這些模型具有更高的查詢準確性,有助於未來人工智慧的發展。隨著科技業不斷演進,蘋果致力於提供更多有關其技術研發的資訊。在最新的公開版本中,蘋果發布了四款開源模型。
蘋果開源高效能LLMs
這些模型被稱為開源高效能 LLMs 或 OpenELMs,它們托管在協作平台 Hugging Face 上。
Hugging Face 是一個用於托管人工智慧模型、訓練以及與他人合作改進的平台。
蘋果模型特點
OpenELM 是一個開源函式庫,利用演化演算法結合了多個大型語言模型 (LLM)。
這四個 OpenELM 模型採用"分層縮放策略",在變壓器機器學習模型的各層中分配參數,以提高精確度。
蘋果預訓練和調整模型
蘋果提供了使用 2.7 億、4.5 億、11 億和 30 億個參數的預訓練和指令調整模型。
預訓練資料集由 Dolma v1.6 子集、RefinedWeb、重複 PILE 和 RedPajama 子集組合而成,總計約有 1.8 兆個標記。
蘋果研究結果
一篇相關論文指出,大型語言模型的可重複性和透明度對於推進開放式研究至關重要,有助於確保結果的可信度,並允許對模型偏差和風險進行調查。
在模型的準確性方面,使用 10 億個參數預算的情況下,OpenELM 比 OLMo 的準確性提高了 2.36%,而所需的預訓練代幣數量僅為 OLMo 的一半。
作者團隊
這些模型和論文的作者包括 Sachin Mehta、Mohammad Hossein Sekhavat、Qingqing Cao、Maxwell Horton、Yanzi Jin、Chenfan Sun、Iman Mirzadeh、Mahyar Najibi、Dmitry Belenko、Peter Zatloukal和Mohammad Rastegari。
蘋果的人工智慧發展
這次發布模型的原始碼是蘋果推動其人工智慧和機器學習發展的最新嘗試。這並非蘋果第一次公開發佈人工智慧程式。
今年 10 月,蘋果分享了一個名為 Ferret 的開源 LLM,改進了模型分析影像的方式。
今年 4 月,Ferret 的新版本增加了解析應用程式截圖中資料點的功能,並大致了解應用程式的功能。
此外,還發布了關於生成式人工智慧動畫工具和建立人工智慧頭像的論文。
預計 6 月的 WWDC24 將包括蘋果產品在人工智慧方面的許多進展。