联系电话: 187-2502-1847

新闻中心

  • 27,Jan,2025

利空英伟达?国产DeepSeek大模型震动全球AI圈,周末疯狂刷屏,量化私募巨头成功跨界AI!

佤邦新世界厅客服上分:近日,DeepSeek公司宣告正式发布最新人工智能模型DeepSeek-R1,并同步开源模型权重。DeepSeek-R1在后练习阶段大规划运用了强化学习技能,在仅有很少标示数据的状况下,极大提升了模型推理才能。
更重要的是,工作人员发现,在DeepSeek-R1-Zero自我学习的进程,随着时刻的添加,该模型“涌现”出了杂乱的行为,如自我反思、评估从前进程、自发寻觅替代方案的状况,还包含一次“尤里卡时刻”(“aha moment”)。“尤里卡时刻”指人类突然了解一个以前无法了解的问题或概念的某个时刻。
轰动全球AI圈
在最近两天DeepSeek-R1引发海外广泛评论后,现在DeepSeek在苹果App Store应用商铺美区免费榜排行第六,逾越Google Gemini、Microsoft Copilot等美国生成式AI产品。今天有网友反映,DeepSeek崩了,提示服务器繁忙。
”英伟达高级研讨科学家Jim Fan表明,DeepSeek-R1或许是第一个展示了RL(强化学习)飞轮可发挥作用且能带来持续增长的OSS(开源软件)项目。加利福尼亚大学伯克利分校教授Alex Dimakis则称,DeepSeek似乎是奔赴OpenAI开端使命的“最佳人选”,其他公司需求迎头赶上。
不过,“深度学习”三巨子之一、图灵奖得主、Meta AI首席科学家杨立昆表明,DeepSeek-R1问世与其说意味着我国公司在AI领域正在逾越美国公司,不如说意味着开源大模型正在逾越闭源。
此外,值得注意的是DeepSeek-R1 API服务定价为每百万输入tokens 1元(缓存射中)/4元(缓存未射中),每百万输出tokens16元,输出API价格只要OpenAI o1的3%。低价背面,明显仍是秀肌肉,价格实力展示了技能实力——从AIInfra 层面降本的技能才能。
在其12月底发布的DeepSeek-V3中,参数量为671B,激活参数为37B,运用的预练习token量为14.8万亿。其多项评测成绩逾越了阿里的Qwen2.5-72B和MetadeLlama-3.1-405B等其他开源模型,并在功能上和世界顶尖的闭源模型GPT-4o以及Claude-3.5-Sonnet不分伯仲。
对于深度求索强大的降本才能,“AI界的拼多多”呼声四起。
DeepSeek不只将模型练习本钱大幅下降,并且发布的新模型R1也同步开源模型权重,公开了完整练习细节,挑战了闭源体系的优势。随着DeepSeek将AI大模型技能及运用门槛下降,有商场人士担忧,DeepSeekR1的崛起或许会削弱商场对英伟达AI芯片需求的预期,对英伟达的商场位置和战略布局产生影响。
网名戏弄:我国股民做出奉献
梁文锋本硕均就读于浙江大学信息与电子工程学专业。2015年,梁文锋与校友共同创建幻方量化。2021年,幻方量化成为国内首家打破千亿规划的的量化私募大厂,被称为国内量化私募“四大天王”之一。早年,幻方量化开端大规划布局 AI 算力,搭建起“萤火一号”集群。2021年,“萤火二号”完工,这给了DeepSeek快速奔驰的底层支撑。

对此,有人戏弄,我国股民给世界AI最大的的奉献就是让幻方量化赚了那么多钱。然后幻方量化创始人有钱买最好的GPU,收纳一批我国最牛的精英,做出了不错的Deepseek。