-
Deepseek恐怕做梦都没料到,一个业余的AI团队,转眼间竟已与华为、TikTok 比肩齐名了。这家成立于2023年的的AI公司Deepseek先是在外网火了,许多人预言:Deepseek很可能会戳破美国史上最大的泡沫。
这两天,总理邀请 Deepseek 创始人梁文锋参加座谈会,相关报道更是登上《新闻联播》,一时间引发广泛关注。
(图为梁文锋参加座谈会)
然后微软总裁纳德拉、扎克伯格、连OpenAI的创始人奥特曼都在称赞Deepseek。甚至整个美国的AI圈都在研究Deepseek发布的V3和R1大模型。
扎克伯格更直接:他呼吁美国政府加紧封锁中国AI技术,还说Deepseek威胁美国国家安全,他要求所有AI员工上阵研究Deepseek的大模型。
扎克伯格很着急,因为支撑Meta 公司股价的就是独霸市场的开源LLaMA模型,这个模型投入已经超过1000亿美元,本来还打算在投入650亿美金做护城河,结果Deepseek只用了Meta 公司一个高管的工资就能做出超过他们几年上千亿美金研发出开源的LLaMA模型。
最主要的是人家的主业是干“量化交易”的,后面干了个副业AI大模型出来,竟然威胁到美国的国家安全了。你说扎克伯格能不急嘛!!!
Meta 公司原本是想通过开源的LLaMA模型,大规模掌控全球商业公司,甚至他可以通过AI技术决定每个公司的生产力水平,让他的开源模型成为AI时代的水和电。
而Deepseek出来后,扎克伯格直接傻眼了,它不仅让英伟达的股价下跌了,还有可能刺破美国史上最大的AI泡沫。
因为Deepseek改变了整个AI大模型的研发模式,Deepseek出来后,只用了少量芯片和不到600万美金就训练出来了,媲美chatgpt O1的模型,成本下降了10倍,效果却不输顶尖的大模型。
这样一来,以后大家对算力的要求降低了太多了,据说AMD已经把Deepseek打包到AMD的解决方案里面了。
以前所有的公司都认为AI大模型需要大力出奇迹,需要对算力进行大量的投资,购买大量芯片,而Deepseek改变了这一认知。老外总是想着问题复杂化,而中国人总是化繁为简。
最最重要的是:Deepseek是按照MIT协议、完全开源的模型,从代码到架构,从理论到训练方法,您随便看随便改随便用。现在全球多个团队,宣布复现了R1的训练过程。
报道说后来研究人员发现,Deepseek稍微深一些的推理仍然不如西方吃算力的大模型,只是某些场景推理能力省算力。
写在最后:
DeepSeek最大的意义是,低成本戳破美国AI的资本泡沫游戏,让AI回归科研本身,开源打破美国的模型壁垒,让全世界都可以参与AI研发。
难怪DeepSeek的老板受到总理接见,还上了新闻联播。
扩展阅读:
DeepSeek,全称杭州深度求索人工智能基础技术研究有限公司,成立于2023年7月17日,2025年1月20日,DeepSeek正式发布 DeepSeek-R1 模型,并同步开源模型权重。创始人梁文锋毕业于浙江大学人工智能专业,曾从事量化投资,后转型AI技术。
顶: 3 踩: 0相关阅读:
来源:卢松松博客 QQ/微信:13340454
难怪Deepseek创始人受到总理接见还上了新闻联播
| 阅读量 | 分类: 微新闻 | 作者: 卢松松
相关文章阅读更多:人工智能AI
- 2025-01-08 万万没想到,AI取代的第一个岗位竟是它?
- 2024-12-21 不是,百度文库都这么牛逼了吗?
- 2024-12-20 库克已纳投名状:苹果AI没得选,只能选百度
- 2024-12-07 英伟达的AI研发中心将会给越南普通人带来什么?
- 2024-11-26 AI带来的赚钱机会,以及利用AI工具提升数倍工作效率
- 2024-11-18 谁能告诉我,李开复和他的零一万物到底做了啥产品?
- 2024-11-12 凭啥起诉我?就因为我把“月之暗面”做到了30亿?
- 2024-11-11 台积电断供芯片和史上最强大的Mate手机
- 2024-11-09 人工智能应用基础知识
- 2024-10-30 国产AI的烧钱大战结束了
- 2024-09-04 AI写作指令有哪些?怎么写AI提示词?
- 2024-09-03 谈一点关于我对AI绘画的想法
- 2024-08-09 夕阳下的域名还能和AI擦出火花吗?
- 2024-08-07 参加AI产品榜线下聚会碎碎念
- 2021-09-08凡是在卢松松博客投稿的作者都有机会得到IT类图书哦!
发表感想加入微信群
壁纸之家