開(kāi) 源
開(kāi)源指的是發(fā)布的模型源碼開(kāi)源、論文或技術(shù)文章開(kāi)源、預(yù)訓(xùn)練的參數(shù)開(kāi)源,可以供研究人員和開(kāi)發(fā)人員訪問(wèn)和修改。
DeepSeek(深度求索)
?中國(guó)AI初創(chuàng)公司深度求索(DeepSeek)發(fā)布的開(kāi)源模型,其最新版本R1以低成本實(shí)現(xiàn)新效能,引發(fā)全球關(guān)注。
Qwen(阿里巴巴)
?阿里巴巴集團(tuán)研發(fā),最新版為Qwen2.5。去年,Qwen2.5在全球最大的AI模型社區(qū)Hugging Face上,超越美國(guó)Meta旗下的Llama系列,成為全球下載量最多的開(kāi)源模型。
Llama(Meta)
?Meta于2023年2月發(fā)布,最新版為L(zhǎng)lama 3.1。Facebook創(chuàng)辦人朱克伯格稱(chēng),開(kāi)源是AI積極發(fā)展的必要條件。
Gemma(谷歌)
?谷歌于去年2月發(fā)布,據(jù)稱(chēng)性能超過(guò)Meta的Llama 2。此前,谷歌的AI模型(Gemini系列)均為閉源。
閉 源
閉源只提供API接口或網(wǎng)絡(luò)頁(yè)面訪問(wèn)服務(wù),一般由公司運(yùn)營(yíng)優(yōu)化,服務(wù)分為免費(fèi)版和收費(fèi)版。
ChatGPT系列(OpenAI)
?由美國(guó)AI巨頭OpenAI開(kāi)發(fā),從GPT-1至GPT-4均為閉源,不公開(kāi)技術(shù)細(xì)節(jié),只能通過(guò)應(yīng)用程序接口(API)使用。馬斯克曾公開(kāi)嘲諷OpenAI(開(kāi)放AI)應(yīng)改名為“CloseAI(閉源AI)”。
Claude(Ahthropic)
?由OpenAI前高管創(chuàng)立的Anthropic研發(fā),最新版本為Claude 3.5 Sonnet,被視為ChatGPT的有力競(jìng)爭(zhēng)者。Claude系列同樣均為閉源模型,其技術(shù)報(bào)告并不提供具體的模型結(jié)構(gòu)、訓(xùn)練方法。
大公報(bào)整理