【iThome新聞】Hugging Face公布可在手機上執行的語言模型SmolLM家族

Thursday July 18th, 2024 , infosec

內容
小語言模型開始加溫，Hugging Face本周公布了可在手機等裝置上執行的小參數量語言模型SmolLM家族，包括1.35億、3.6億及17億參數模型。
能在本地裝置執行的小型語言模型成為最新市場焦點，目前已公布的小模型有微軟Phi系列、阿里巴巴的通義千問Qwen 2（不到20億參數）及Meta的MobileLLM，若設計和訓練得當都可以得到很好的效果。但是關於這些模型的資料策畫（curation）和訓練的資訊卻不為大眾所知。