幻方量化旗下模型DeepSeek上線V3版本
2024-12-27 08:48
12月26日,幻方量化全新系列模型DeepSeek-V3首個(gè)版本上線并同步開(kāi)源,API服務(wù)已同步更新,接口配置無(wú)需改動(dòng)。當(dāng)前版本的DeepSeek-V3暫不支持多模態(tài)輸入輸出。據(jù)介紹,DeepSeek-V3為自研MoE模型,671B參數(shù),激活37B,在14.8Ttoken上進(jìn)行了預(yù)訓(xùn)練,其多項(xiàng)評(píng)測(cè)成績(jī)超越了Qwen2.5-72B和Llama-3.1-405B等其他開(kāi)源模型,并在性能上和世界頂尖的閉源模型GPT-4o以及Claude-3.5-Sonnet不分伯仲。
編輯/李雅本平臺(tái)發(fā)布/轉(zhuǎn)載的內(nèi)容僅用于信息分享,不代表我司對(duì)外的任何意見(jiàn)、建議或保證,我們倡導(dǎo)尊重與保護(hù)知識(shí)產(chǎn)權(quán),如發(fā)現(xiàn)本站文章存在版權(quán)問(wèn)題,煩請(qǐng)將版權(quán)疑問(wèn)、授權(quán)證明、版權(quán)證明、聯(lián)系方式等,發(fā)郵件至info@tonews.cn,我們將第一時(shí)間核實(shí)、處理。同時(shí),歡迎各方媒體、機(jī)構(gòu)轉(zhuǎn)載和引用,但要嚴(yán)格注明來(lái)源:今日商訊。