来源:上海证券报 作者:郑维汉
2月25日,DeepSeek API开放平台已重新开放API充值。目前,DeepSeek-R1百万tokens输入价格(缓存命中)为1元、百万tokens输入价格(缓存未命中)为4元,百万tokens输出价格为16元。DeepSeek-V3的百万tokens输入价格(缓存命中)为0.5元、百万tokens输入价格(缓存未命中)为2元、百万tokens输出价格为8元。
此前,因服务器资源紧张,DeepSeek曾一度停止充值。
同日,DeepSeek发布DeepEP,是一种用于混合专家(MoE,Mixture of Experts)模型训练和推理的开源EP通信库。具备高效的all-to-all通信、节点内和节点间(intranode and internode)均支持NVLink和RDMA等特点。
DeepSeek于2月24日启动“开源周”,开源了首个代码库FlashMLA。DeepSeek称,这是DeepSeek针对英伟达Hopper架构GPU优化的高效MLA解码内核,专为处理可变长度序列而设计,现在已经投入生产使用。其能在H800上能实现3000GB/s的内存带宽以及580TFLOPS的计算性能。
值得注意的是,近日,黄仁勋在一档采访节目中回应了DeepSeek带来的冲击。
黄仁勋表示,市场对DeepSeek-R1模型带来的冲击判断错误,误以为这对英伟达及人工智能(AI)产业是不利的,仿佛算力不再重要。但恰恰相反,DeepSeek不仅不会终结AI计算需求,还会推动整个行业的发展。
黄仁勋解释道,R1的发布让人们注意到,模型的效率远超此前我们的想象。因此,AI将加速普及,也就意味着市场仍然需要计算资源,这本质上利好AI市场。
此外,黄仁勋表示,虽然DeepSeek在AI模型的预训练方面取得了进步,但作为模型学习解决问题的关键环节,后训练仍然很重要,该阶段仍需要大量的资源,并且推理本身就是一个需要密集计算的过程。