DeepSeek 由中國量化交易巨頭幻方量化創立,專注開發大型語言模型並堅持開源策略,V3 以超低成本與 GPT-4 媲美,擁有 671B 參數及創新 MLA、MTP 等技術;R1 更藉強化學習強化思考能力,展現自我反思、多元解法等 Emergent Behavior,對 AI 產業影響及意義深遠。
◖ 爾科,關照「你」的一身 ◗
DeepSeek 由中國量化交易巨頭幻方量化創立,專注開發大型語言模型並堅持開源策略,V3 以超低成本與 GPT-4 媲美,擁有 671B 參數及創新 MLA、MTP 等技術;R1 更藉強化學習強化思考能力,展現自我反思、多元解法等 Emergent Behavior,對 AI 產業影響及意義深遠。