全面超越Deepseek，阿里大年初一放大招

私信卢松松，加入【微信交流群】
| 528 阅读量 | 分类: 微新闻 | 作者: 卢松松 | 时间：2025年01月30日 11:23

请先记住这个词：Moe模型。因为这个词未来会改变AI圈、改变金融圈、改变英伟达、甚至改变中美AI走向。

故事起因是这样的：

10天前，大家都准备回家过年了，结果来自浙江的一家小公司DeepSeek(深度求索)火了，它发布的V3模型，震惊了美国AI圈和金融圈，还上了新闻联播，一夜之间和华为、阿里比肩齐名了，搞的扎克伯格一度呼吁美国加紧封锁中国AI技术。

全面超越Deepseek，阿里大年初一放大招人工智能AI 阿里云微新闻第1张

这么大事，你让别的AI公司怎么办?火车票都买好了，结果又来加班，好在阿里云是反应最快的那个，他们的算法专家立刻找到问题关键点：

DeepSeek用的是Moe模型，阿里的Qwen用的还是Moe模型。

在Moe架构领域，Qwen是规模最大的那一个，又有20万亿Tokens(相当于1.5亿本小说)。为什么DeepSeek能火爆全网、气死扎克伯格，而Qwen不能?于是阿里的工程师加班加点，甚至把车票都退了，终于在大年初一，发布了新的模型Qwen2.5-Max。注意是：Max版，就和手机一样，就是顶配版的意思。

Qwen2.5-Max一发布，高级算法专家林俊旸就发了个圈：

全面超越Deepseek，阿里大年初一放大招人工智能AI 阿里云微新闻第2张

Qwen2.5-Max这个版本最牛逼的2点是：
(1)超大规模的MoE模型，预训练数据超20万亿Tokens。
(2)全面超越DeepSeek V3

简单的说，就是性能更牛了，但更节约算力了。

全面超越Deepseek，阿里大年初一放大招人工智能AI 阿里云微新闻第3张

如上图所示，Qwen2.5-Max的各项指标都略高于DeepSeek和LLaMA模型。

在告诉大家一个冷知识：阿里的千问、DeepSeek(深度求索)、Meta的LLaMA的底座都是MoE模型‌。

全面超越Deepseek，阿里大年初一放大招人工智能AI 阿里云微新闻第4张

说了半天，估计好多人不知道什么是Moe模型吧?

简单点说：Moe模型(混合专家模型)是AI圈热门的大模型架构，它只需要激活必要的参数来处理输入的数据，减少主动计算需求的同时，使得计算成本得以大幅降低，推理性能也有所改善。不会相应增加训练和运行模型所需的计算负担，所以能同步降低训练成本。

这个架构最牛逼之处，就是主动减少计算需求，主动计算需求减少，自然节约算力，算力节约了就能节约芯片数量。这就是为什么DeepSeek能用Meta公司1/10的价格，训练出跟LLaMA模型差不多的大模型的原因。

这也是为什么扎克伯格气的牙痒痒的原因：我花了1000亿美刀做出的开源LLaMA模型，你小子花550万就做出来了。你说能不急吗?预计用不了多久，扎克伯格也会学习Deepseek的方法。等Meta 公司的 LLaMA 模型学习差不多了，估计就没Deepseek什么事了。

所以阿里的Qwen赶在Meta之前，发布全新Qwen2.5-Max版本，性能超越了Deepseek，更牛了，也更节约算力了。这样一来，以后大家对算力的要求降低了太多了，以后也不需要那么多芯片了，更没人大量屯芯片了。那以后谁还买英伟达的芯片啊?

以前所有的公司都认为AI大模型需要大力出奇迹，需要对算力进行大量的投资，要购买大量芯片，可现在一切即将改变，这是今年AI一个重要转折点，阿里起了个头，预计会有更多公司都会朝这个方向努力：节约算力，提升性能。但这样，英伟达的黄仁勋就要哭啦。

写在最后：

今年的阿里云要起飞了，先是登陆了央视春晚，大年初一又发了新的模型。阿里新发布的Qwen2.5-Max这个版本的起了个头，目测这一模型会引领新的AI方式。

如果说DeepSeek的低成本戳破美国AI的资本泡沫游戏，那么阿里云的Qwen则让AI回归科研本身，打破美国的模型壁垒，让全世界都可以参与AI研发中来了。

相关阅读：
争光了！中国AI大模型全球排名第一
谁能赢？阿里的通义 VS 百度的文心
阿里云VS腾讯云，谁才是中国未来云计算之王？
难怪Deepseek创始人受到总理接见还上了新闻联播

顶: 0 踩: 0

来源：卢松松博客 QQ/微信：13340454 ，转载请注明出处！

本文地址：https://lusongsong.com/blog/post/18668.html

发表感想加入微信群

热门跟帖

最新跟帖

1楼

大鱼笔记

AI已经进入白热化竞争趋势了。

评论来自电脑端 · 中国广东广州时间:2025-03-09 15:48:33

顶: 0 踩: 0 回复

2楼

cad视频教程

说都懂，做都难成功的因素很多。,小红书牛号。

评论来自电脑端 · 中国辽宁沈阳时间:2025-02-18 03:46:30

顶: 0 踩: 0 回复

3楼

免费自学教程

写的真不容易,有一定的道理有钱人不需要懂那么多，有专业人士

评论来自电脑端 · 中国海南海口时间:2025-02-09 10:15:23

顶: 0 踩: 0 回复

4楼

百度指数提升

感觉就是互相吹捧的吧

评论来自电脑端 · 中国浙江嘉兴时间:2025-02-07 15:26:56

顶: 0 踩: 0 回复

5楼

大军自由赚

治好了大公司病，阿里就能成功

评论来自电脑端 · 中国浙江湖州时间:2025-02-07 14:41:08

顶: 0 踩: 0 回复

6楼

会议设备

反者道之动，弱者道之用

评论来自电脑端 · 中国上海时间:2025-02-03 12:04:35

顶: 1 踩: 0 回复

7楼

测厚仪

气死美帝

评论来自电脑端 · 中国河北沧州时间:2025-02-03 06:57:04

顶: 0 踩: 0 回复

8楼

会议设备

阿里肯定不会成功

评论来自电脑端 · 中国上海时间:2025-02-01 21:50:47

顶: 2 踩: 0 回复

9楼

2026年元旦

阿里机构臃肿，创新乏力

评论来自电脑端 · 中国上海时间:2025-02-01 21:00:29

顶: 0 踩: 0 回复

相关文章阅读更多：阿里云 人工智能AI

2025-07-24 5分钟干1周的活，阿里开源地表最强AI编程助手
2025-07-24 让 AI 帮我部署网站，太方便了！
2025-07-22 CNNIC最新报告透露5大真相，普通人机会在哪？
2025-07-17 GEO优化3年内难成气候，但谁不布局谁吃亏
2025-07-11 百川智能高管集体跑路!王小川的医疗AI还能赢吗?
2025-06-12 第一批AI已经在取代自媒体作者了
2025-06-11 算力翻倍、股价起飞，AI时代的财富大迁徙已开始！
2025-05-27 DeepSeek、豆包、Kimi、百度文心一言、腾讯元宝、通义、智谱、天工等AI生成内容信息采集主要来自哪？占比例是多少？
2025-05-19 我滴妈，小米芯片一出道就是世界顶级水平
2025-05-16 AI 重新定义了短视频、直播间甚至人类吗
2025-05-06 数字人做短视频有流量吗？为什么说结合AI技术让推广获客转化更高效
2025-04-29 阿里云赌对了！Qwen3成全球最强开源AI
2025-04-27 全球AI巨头正在赌：谁搞定MCP，谁就是未来老大
2025-04-21 为什么百度搜索、微信搜索要接入AI大模型DeepSeek？对谁更有好处
2021-09-08凡是在卢松松博客投稿的作者都有机会得到IT类图书哦！