后又发布消息:“感谢网友的热心提醒,Colossal-AI此前发布对DeepSeek-R1(671B)模型的LoRA微调,在参数加载过程中因参数名称不匹配的Bug导致Loss异常,已在GitHub线上修复。”
除此之外,潞晨科技创始人尤洋和硅基流动创始人袁进辉,在社交平台公开互怼的内容也引来了大量吃瓜群众。
这是两家大模型服务公司。尤洋质疑硅基流动的商业模式和技术水平,袁进辉则回应并指责潞晨科技存在抄袭行为。随后,潞晨科技宣布将暂停DeepSeek API服务。
事件发生的背景是:春节期间DeepSeek访问量暴增经常无法访问,硅基流动趁此机会发出了DeepSeek API并对自己的产品做了一宣传,因此发出了不少代金券,其网站访问量也随之大增。
周末,尤洋在知乎发文《坑人的硅基流动》,表示硅基流动的袁进辉老师频繁在朋友圈里阴阳他,并称“这家公司疑似组织水军在网上长期黑我。今天DeepSeek有一篇文章指向我,他也在那里煽风点火。”
2月12日superclue发布评测把硅基流动的API性能排到倒数第一,袁进辉老师发朋友圈说不公平。
其实我觉得superclue是公平的,因为实质上评测的就是硅基流动的付费版的。如果这不是付费版的,小红书那帮单纯的学生岂不是被骗了?代金券还有意义吗?
这种拉人头的传销方式其实不太好,周鸿祎老师前几天还发了个类似的道歉视频。潞晨科技也想过用这种方式,但是我们平台背后是真算力,真的无法贬值。
硅基流动PR稿里说自己有300万用户,我看小红书很多用户说自己的代金券刷到了1000元。假定平均每个用户500元,这样硅基流动有15亿的代金券需要兑现,但是这家公司只有1—2亿的现金。风险很大。所以他们必须要模型。
对此,硅基流动创始人袁进辉在朋友圈公开回应,并透露“硅基流动被潞晨科技抄袭,只是为了给对方留个面子没有公开。”
3月1日,DeepSeek在知乎上发表题为《DeepSeek-V3/R1 推理系统概览》的文章,全面揭晓V3/R1 推理系统背后的关键秘密。最为引人注目的是,文章首次披露了DeepSeek的理论成本和利润率等关键信息。
不过,DeepSeek也强调,实际上的收入或许并没有那么多,因为V3的定价相较于R1要更低,另外夜间还会有折扣。
2月26日,DeepSeek在其API开放平台发布错峰优惠活动通知。根据通知,北京时间每日00:30-08:30为错峰时段,API调用价格大幅下调,其中DeepSeek-V3降至原价的50%,DeepSeek-R1降至25%。DeepSeek鼓励用户在该时段调用,享受更经济更流畅的服务体验。
根据模型价格细节,在标准时段(北京时间08:30-00:30),V3和R1的百万tokens输入(缓存命中)价格分别为0.5元和1元,百万tokens输出分别为8元和16元,R1均为V3的两倍。而在优惠时段(北京时间00:30-08:30),V3和R1的百万tokens输入(缓存命中)则均降为0.25元,百万tokens输出均降为4元。
不过尤洋的上述言论已经删除。今晨,尤洋发文致歉,称“本人昨天情绪太冲动,说了一些让人误解deepseek infrastructure团队的话。deepseek infrastructure团队技术一流并给开源社区做出巨大贡献。本人诚挚道歉,已经删除不当表述,感谢大家提醒!”。
《2014年版中國汽油箱項目建議書》是中商情報網針對汽油箱行業投資項目設立的必要性和可能性進行論證的專項研究報告。報告主要描述了汽油箱行業市場容量、供需情況、競爭狀況、項目的投資風險和...
据介绍,根据气象监测情况,今年4月下旬以来,全省平均降水量26.6毫米,较常年同期偏少75%,截至6月13日,大部分地区连续无有效降水日数超60天,郑州等10个地市在70天以上;平均气...
大鹏导演、主演的电影《长安的荔枝》近日官宣,定档今年暑期档;同名剧版,由雷佳音主演,于去年拍完并发出了预告。 这部“爆款”作品的创造者,是一个...
(吃瓜速报)谁能想到,一首洗脑儿歌《挖呀挖》竟炸出一场一个亿的惊天大瓜!近日,凭魔性教学视频血洗热搜的黄老师被传挖出上亿身家,相关词条直接爆了热搜。面对网友人均列文虎克的扒皮质疑,黄老...
一个好的问题会引来无数好的回答,它们不仅是好奇心和知识探索的体现,更是时代发展和社会变迁的见证。12月20日,“知乎2024”年度盘点系列活动正式上线年的“年度十问”,十大问题覆盖人文...
三言Pro消息 国内大模型圈的竞争向来安安静静,除了发个测试排名比一比,基本上相安无事,更别提口水战了。 大概从三四个小时前开始,两家大模型公司潞晨科技创始人尤洋...