【美今詩歌集】【作者:童驛采】1999年~2020年 |訪問首頁|
墨龍上海論壇
   

墨龍上海論壇

 找回密碼
 立即註冊
搜索
查看: 24|回復: 0

DeepSeek又崩了,年内18次异常

[複製鏈接]

46

主題

0

回帖

230

積分

中級會員

Rank: 3Rank: 3

積分
230
發表於 2026-5-29 16:22:39 | 顯示全部樓層 |閱讀模式
公司服务状态页面显示,DeepSeek网页对话及API服务于上午10时21分出现中断,并于10时50分恢复服务。根据官网状态页数据,这已经是DeepSeek自2026年以来出现的第18次部分性能异常,也是本月的第5次。

业内共识认为,频繁异常的直接原因是算力供需失衡、系统弹性不足。更深层的矛盾在于,互联网“免费获客—后期变现”的经典路径,在推理成本高企的大模型C端市场,已难持续。
纯免费模式很难持久
在互联网时代,许多免费产品的边际成本趋近于零。但对于大模型,尤其是推理模型而言,每一次对话都需消耗实实在在的算力、显存带宽。用户越活跃,边际成本越发刚性,这与传统互联网模式下成本随规模扩大而逐渐摊薄的逻辑截然不同。
然而,C端需求十分旺盛。根据OpenRouter监测数据显示,上周(5月18日至5月24日)全球AI大模型总调用量攀升至28.9万亿Token,连续五周上涨;其中,中国大模型周调用量达9.22万亿Token,环比激增19.89%,连续四周超越美国(4.93万亿Token,环比增长16.27%)。DeepSeek-V4-Flash更以单周3.43万亿Token、环比暴涨66%的成绩登顶全球榜首。
向安玲认为,对大模型可持续发展而言,比较现实的方案有两种:一是分层收费,基础版免费,用于日常问答和轻量任务以实现获客;深度推理、长上下文等增强功能则收费,或采用按量收费,设定免费阈值,超出后按Token计费;二是B端反哺C端的路径,B端企业的付费意愿更成熟,可通过私有化部署、定制化方案或售卖算力和API获得收入,再用这笔收入补贴C端的免费服务,同时将C端沉淀的脱敏使用数据包装成产品卖给B端。
DeepSeek已经出手,进一步吸纳API付费用户。
5月22日晚间,DeepSeek官方宣布,DeepSeek-V4-Pro模型API价格将于2026年5月31日结束限时优惠后将不再恢复原价,而是正式调整为原定价的1/4。这意味着此前2.5折的折扣将永久保留。
据官方披露,DeepSeek-V4采用自研稀疏注意力机制与混合专家模型,在处理百万级Token长上下文时,算力消耗仅为上代产品的27%,大幅减少了单位推理成本。同时,V4兼容华为昇腾等国产芯片,大幅摆脱对海外高端算力的依赖,有效降低了硬件采购与运维成本。
2026年以来,由于HBM(‌高带宽内存‌)价格半年暴涨超500%,高端GPU(图形处理器)供不应求,加上推理端调用量激增,亚马逊、微软及国内主流云厂商纷纷上调API定价。DeepSeek和小米是其中的两个异类。5月27日,小米旗下MiMo团队宣布,MiMo-V2.5系列大模型API永久降价,最高降幅达到99%。17吃瓜

回復

使用道具 舉報

高級模式
您需要登錄後才可以回帖 登錄 | 立即註冊

本版積分規則

Archiver|手機版|小黑屋|墨龍上海論壇

GMT+8, 2026-6-24 07:22 , Processed in 0.119569 second(s), 19 queries .

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回復 返回頂部 返回列表