国产大模型DeepSeek震惊世界:团队没有“海归”,训练成本不到GPT
国产大模型DeepSeek超越ChatGPT,登顶苹果中国和美国应用商店免费APP下载排行榜,成为了全球科技圈的热议话题。
DeepSeek登顶苹果美国区免费APP下载排行榜
1月27日,苹果App Store中国区免费榜显示,DeepSeek站上首位。同时,DeepSeek在美区苹果App Store免费榜从昨日的第六位飚升至第一位,超越ChatGPT及Meta公司旗下的社交媒体平台Threads,以及Google Gemini、Microsoft Copilot等美国科技公司的生成式AI产品。
DeepSeek爆火后曾出现两次宕机。
1月26日,DeepSeek曾出现短时闪崩现象。对此,DeepSeek回应称,当天下午确实出现了局部服务波动,但问题在数分钟内就得到了解决。此次事件可能是由于新模型发布后,用户访问量激增,服务器一时无法满足大量用户的并发需求。
今日又有消息称DeepSeek服务状态页面显示,DeepSeek网页/API不可用,目前正在调查该问题。
和国内AI公司背靠互联网大厂不同,DeepSeek由量化对冲基金幻方量化运营。2016年,幻方量化推出首个AI模型,第一份由深度学习生成的交易仓位上线执行。到2017年底,几乎所有的量化策略都采用AI模型计算。2023年,幻方量化宣布成立创新性大模型公司DeepSeek。
2024年12月,DeepSeek-V3首个版本上线,并同步开源,训练成本仅为557.6万美元,整个训练只需要280万个GPU小时。
1月20日,DeepSeek又正式开源R1推理模型。1月24日,DeepSeek-R1在Chatbot Arena综合榜单上排名第三,与OpenAI的顶尖推理模型o1并列。
从硅谷到华尔街,DeepSeek掀起涟漪
DeepSeek的影响迅速蔓延至大洋彼岸的硅谷。据澎湃新闻援引Information网站报道,脸书母公司Meta成立了四个专门研究小组来研究量化巨头幻方量化旗下的国产大模型DeepSeek的工作原理,并基于此来改进旗下大模型Llama。
DeepSeek之所以引发科技圈关注最主要的原因在于其以极小的成本训练出能和OpenAI的ChatGPT 一较高下的人工智能大模型。
据每日经济新闻报道,DeepSeek的R1的预训练费用只有557.6万美元,仅是OpenAI GPT-4o模型训练成本的不到十分之一。同时,DeepSeek公布了API的定价,每百万输入tokens 1元/4元(缓存未命中),每百万输出tokens 16元。这个收费大约是OpenAI o1运行成本的三十分之一。
受此消息影响,华尔街也作出相应反应。
据21世纪经济报道,美股大VTHE SHORT BEAR在社交媒体上表示,DeepSeek创造了一个AI巨头们的痛苦时刻,而投资者必须对此敲响警钟。
如果击败OpenAI所需要的金额是5500万美元,那么这个行业的商业化会比很多人预想的要快很多。
1月25日,AMD宣布,已将新的DeepSeek-V3模型集成到Instinct MI300X GPU上,该模型旨在与SGLang一起实现最佳性能。DeepSeek-V3针对Al推理进行了优化。这对于在AI竞赛时代一直颇为风光的英伟达略显尴尬。
据财联社报道,本周一,在亚洲盘交易时段,美国股指期货大跌,而这背后的主要原因,可能就是华尔街人士们担心DeepSeek的AI模型可能会颠覆美国科技界。
与此同时,在日本东京股市,英伟达的主要供应商Advantest Corp.的股价一度暴跌了8.6%。
本土阵容打造国产大模型黑马,实习生日薪最高上千元
1月26日,《黑神话:悟空》制作人冯骥评价DeepSeek:可能是个国运级别的科技成果。
而这一科技成果背后是一个完全本土化的阵容,据大象新闻报道,DeepSeek团队不到 140 人,但 人才密度 极高,成员多是来自清华、北大、北航等顶尖高校的应届博士毕业生、在读生以及硕士生。值得一提的是,团队没有海归,完全本土人才。
我们的核心技术岗位主要由今年或过去一两年毕业的人员担任,DeepSeek创始人梁文峰在2023年接受媒体采访时表示。
此前,DeepSeek开源大模型DeepSeek-V2的关键开发者之一罗福莉就曾被雷军以千万年薪招揽。
DeepSeek爆火后,媒体也发现DeepSeek正在招聘。招聘网站显示,DeepSeek的北京子公司正在招人,现共放出了52个岗位,包括深度学习研究员、核心系统研发工程师以及资深ui设计师等,均为14薪。其中,薪资最高的为核心系统研发工程师,薪资范围为6万元-9万元;除此之外,大部分岗位的起薪在2万元及以上。值得一提的是,该公司正在招聘实习生,AGI大模型实习生的工资为500元/天-1000元/天,数据百晓生实习生为500元/天-510元/天。
从OpenAi横空出世,到DeepSeek以黑马之姿震惊世界,AI时代一日一变,一切皆有可能。
声明:以上内容为本网站转自其它媒体,相关信息仅为传递更多企业信息之目的,不代表本网观点,亦不代表本网站赞同其观点或证实其内容的真实性。投资有风险,需谨慎。
我来说两句
推荐阅读
-
中国银行:下半年我国经济或快速复苏,全年增长4%左右图片来源:人民视觉中国银行研究院周二发布《2022年三季度经济金融展望报告》称,下半年我国宏观经济或将进入快速复苏通道,...
-
上财:今年中国经济或增长4.3%,需高度关注青年就业2017年10月25日,西安,长安大学校园内,学生们在秋雨中现场求职。图片来源:人民视觉上海财经大学高等研究院本周发布报...
-
央行报告:2021年企业贷款利率创新低,东北降幅最大2022年6月13日,辽宁沈阳,工人在水发航宇星物联科技(辽宁)有限公司生产线上制造安全控制型膜式燃气表。图片来源:人民...
-
一个月股价大涨近50%,东瑞股份加大押注“猪周期”,定增图片来源:图虫创意7月8日(周五),东瑞股份(001201.SZ)股价收于44.90元,涨7.78%,自5月30日以来其...
-
太阳能行业周报:产业链价格齐涨硅料涨势将延续多晶硅价格硅业分会和PV-InfoLink数据显示,本周全国单晶致密材料成交均价为28.96万元/吨,较前一周上涨1.9...
-
种业专家创新大讲堂在京成功举办7月9-10日,由中国农业科学院主办,人力资源和社会保障部、农业农村部联合主办的专家创新大讲堂在北京举行。本次大讲堂以“...
-
“20恒大01”本息兑付再展期议案未获债券持有人投票通过7月11日上午,恒大地产发布公告称,《关于调整“20恒大01”债券本息兑付安排的议案》未获债券持有人大会通过。恒大地产表...
-
城市圈乘车码互通刷码乘地铁哪家强?2017年起,公交码成为公交、地铁的标配。深圳地铁依然“孤傲”地实现北上广深的互通。三年前,上海地铁MetroMetro...
-
乘联会6月新能源汽车销量榜:比亚迪、特斯拉、五菱前三,问2022年6月全国乘用车市场分析报告显示,2022年6月新能源乘用车批发销量达到57.1万辆,同比增长141.4%,环比...
-
Minisforum介绍新款UM560迷你主机,支持US今年6月,Minisforum发布了新款UM560miniPC,搭载AMD6核R55625U处理器,支持USB-C一线连...
作者信息