Drift 671B的DeepSeek-V3刚刚正式开源! 简单介绍一下好吧 DeepSeek-V3是一款由深度求索科技公司开发的最新开源人工智能大模型,具有6710亿个参数,采用了混合专家(Mixture of Experts, MoE)架构。该模型在14.8万亿个高质量token上进行了预训练,激活了37亿个参数,旨在提供高效的推理和训练能力。尤其是在与闭源模型的竞争中展现出强大的潜力。 推理速度60token/秒(比V2快3倍) 128K上下文 MoE架构有兴趣可以去看看 deepseek-ai/DeepSeek-V3