DeepSeek半夜更新OCR2,用的却是阿里的Qwen

|  阅读量 | 分类: 微新闻 | 作者: 卢松松 | 时间:2026年01月27日 20:22

阿里半夜刚发完旗舰Qwen模型,行业解读数据还没出来呢,DeepSeek 凌晨就甩出一个升级版 DeepSeek-OCR 2,而且用的正是阿里的 Qwen。

香槟还没来得及开,就被人拿去干活了。

DeepSeek半夜更新OCR2,用的却是阿里的Qwen 人工智能AI 阿里云 微新闻 第1张

DeepSeek半夜更新OCR2,用的却是阿里的Qwen 人工智能AI 阿里云 微新闻 第2张

这个时间点,明显不是偶然

但DeepSeek没有硬钢大模型参数,而是选择了:OCR。

更有意思的是:它用的不在自家模型,而是Qwen2-0.5B。DeepSeek团队在论文中自己也说了,这就有意思了。

DeepSeek半夜更新OCR2,用的却是阿里的Qwen 人工智能AI 阿里云 微新闻 第3张

注意这个数字:0.5B。

在今天这个动不动就几十 B、上百B的年代,这个模型规模说白了是很小、很小了。但 DS 就用这么个配角,干了一件让行业震惊的大事。

DeepSeek 让AI学会了抓重点

去年10月DS团队就发布了OCR1,把图像压成少量token喂给AI,取得了巨大的成功,说明方向是对的,但大家没当回事。

但这次不一样了。DeepSeek-OCR 2是在行业内做了个大创新:是读图,是先推理图的阅读顺序。

DeepSeek半夜更新OCR2,用的却是阿里的Qwen 人工智能AI 阿里云 微新闻 第4张

传统 OCR 是什么?不管是风景还是文字,一律先扫一遍,这样挺浪费算力的,

而这次OCR2解决的是:图片上哪里可能有信息、哪个地方更重要、哪些地方可以不看,属于边看边理解。

最反常的地方:只用了 0.5B

和很多人觉得0.5B太小了,用起来没面子。

但在内行人眼里看:DeepSeek只用了Qwen2-0.5B的数据就搞定了 OCR2,这意味着法拉利加兑了水的柴油,也能跑到极速。

DeepSeek半夜更新OCR2,用的却是阿里的Qwen 人工智能AI 阿里云 微新闻 第5张

举个例子:如果用70B的大模型识别图片,识一张图可能要5分钱;但用Qwen2-0.5B,成本可能连5厘钱都不到。而且0.5B的模型非常小(大概就几百MB),这意味着你手机上、汽车芯片里,可以直接装了,几百块钱就能搞定。

DeepSeek团队能把Qwen2-0.5B玩出花来,说明是真本事!

其次,程序员也喜欢用0.5B小模型,因为这款模型稳定、成本低、好部署,特别适合二次开发。

所以这件事至少说明了三点:

(1)说明DeepSeek根本不在乎底座是不是自己的,只要能用就行,非常务实。

(2)说明AI模型不在参数多大,0.5B的袖珍级模型,一样创造神话。

(3)也是最容易被忽略的一点:越来越多关键项目,开始默认用阿里的Qwen了。

这条路一旦走通,谁会最先倒霉?

DeepSeek OCR 2 这种路线一旦跑通,那将对许多行业的影响是致命的。

(1)银行领域,尤其是放贷,一个人要看一天,一旦用上了OCR配合AI,那么几秒就能出结果了。

(2)医疗领域,那些老大夫写的潦草的汉字、化验单,用OCR+AI就能猜出医生开的是什么药。

(3)自动驾驶领域,汽车可以更轻松的读路牌、读红绿灯、读仪表板,以后的识别率会更高。

(4)教育领域,孩子手写作业、试卷批改,老师的重复劳动会被快速压缩。

DeepSeek半夜更新OCR2,用的却是阿里的Qwen 人工智能AI 阿里云 微新闻 第6张

(AI眼中的路牌)

真正致命的,是它把成本打下来了

你可能会说:这些功能以前不也有吗?

有,但不一样。

DeepSeek半夜更新OCR2,用的却是阿里的Qwen 人工智能AI 阿里云 微新闻 第7张

这意味着:DeepSeek OCR2的识别准确率提升到 91.09%,整体成本至少下降 50%。

更意味着原本只有大公司能用的起的OCR,现在小团队也能用的上来。如果 OCR 2 这条路走通了,大模型的整体使用成本,很可能在降低50%。

Qwen,正在悄悄变成底座!

它的优势不是“新”,而是:体积小、性能稳定、好适配、工程友好。

以前很多视觉识别、自动驾驶,必须联网、必须高算力。而在DeepSeek团队的这种思路下:不联网也能用、算力更低、价格更便宜了。

而且DeepSeek可不是个例:

(1)日本的Abeja,用 Qwen 训练出了多个日语大模型,成了日本当地的“国货之光”。

(2)英国牛津大学OxValue.AI公司也用Qwen做了一套财务估值系统。

写在最后:

DeepSeek 是这两年国内最激进的一家开源模型团队。他不爱卷模型、特别喜欢改结构,几乎所有的模型都直接开源了。

别人拼的是谁的模型更大、谁的算力更牛,可DeepSeek拼的是:用最少的钱,干最多的活。

这次 OCR 2,本质也是这个思路。

最后你会发现,Qwen 从来不靠吆喝,但它已经悄悄进了无数产品的底层。真正改变行业的技术,往往不是被讨论最多的那个。

相关阅读:

deepseek对普通人有什么用

争光了!中国AI大模型全球排名第一

全面超越Deepseek,阿里大年初一放大招

震惊全球开源圈的大瓜:Meta偷师阿里千问

顶: 1 踩: 0

来源: QQ/微信:13340454 ,转载请注明出处!

本文地址: