DeepSeek-V3.2 正式版現(xiàn)已上線青云科技旗下 AI 算力云服務(wù)——基石智算CoresHub 大模型服務(wù)平臺。經(jīng)過測試,DeepSeek-V3.2 在推理能力上比肩 GPT-5,性能強勁。
模型特點
● 引入了新的上下文注意力機制 DSA
作為一種高效的注意力機制,DSA 顯著降低了計算復(fù)雜性,使得模型在較長下文場景下的速度得到提升,且能力依然較強,特別針對長上下文場景進行了優(yōu)化。
● Agent 任務(wù)能力大幅提升
DeepSeek-V3.2 支持了思考模式下的工具調(diào)用能力,將推理融入工具使用場景,通過合成管道,系統(tǒng)地生成大規(guī)模訓(xùn)練數(shù)據(jù),提高了在復(fù)雜交互環(huán)境中的模型表現(xiàn)能力。
登錄 CoresHub.cn,即可立即體驗 DeepSeek-V3.2,支持多種調(diào)用方式,用戶可參考:https://docs.coreshub.cn/console/big_model_server/call_scenario/。