-  
有些朋友可能会说,DeepSeek、豆包、Kimi、百度文心一言、腾讯元宝、通义、智谱、天工等AI大模型默认开不开启联网搜索有什么差别呢?
我想说,这个差别大着呢。
我们做AI搜索优化,或者说叫GEO,如果不是联网搜索的情况下,我们很难快速优化进AI大模型结果里。因为AI大模型训练间隔比较久,而且费用也不便宜,要想了解实时性的东西,所以他们只要有,都加上了联网搜索功能。
而对于AI大模型的用户而言,他不可能在提问之前,先去打开联网搜索之类(只有少部分专业的人会去这么做)。
就像我们说做百度、抖音或微信搜一搜关键词搜索排名一样,用户默认会看全部排名,很少去点具体某个垂直下面结果一样,如图:


哈哈哈,看上图,才发现,微信搜一搜直接也把【AI搜索】放在TAG上了,你们看下有没有?
好,我们继续。
正因为大模型如果从原来不是默认开启联网搜索到现在默认开启,那么我们做AISEO即AI搜索优化,不管是做品牌曝光还是引流量还是营销,都有机会了是不是?当然,比如像通义现在还是默认没开启哈~
为什么今天想到分享要说下DeepSeek、豆包、Kimi、百度文心一言、腾讯元宝、通义、智谱、天工等AI生成内容信息采集主要来自哪这个事呢?

我在想不管是做AI搜索优化这行的转行的SEO或者其它行业同行,又或者是想做AI搜索优化的企业,他们是不是都想知道呢,这样更好做好AI搜索优化(GEO)。
所以,除了DeepSeek、豆包、Kimi、百度文心一言,我还加了腾讯元宝,通义(原通义千问,改名缩短了,PC和APP一致),智谱(智谱清言简称),天工(AI搜索引擎工具)等AI生成内容的。
好,我们就一个一个来说一下。
1、DeepSeek AI生成内容信息采集主要来源及占比参考
DeepSeek AI生成内容信息采集主要来源,按照DeepSeek自己的说法是开源数据(MIT协议允许自由使用)、强化学习生成数据、少量标注数据。
你可能没懂,简单说就是互联网上的内容以及它自己再生成的,以及非常少的标注的。但我们能优化的是开源数据。这个主要来源,来自白杨SEO朋友公司客户案例统计如图(他们的业务介绍PPT)

从上图看到主要来源是媒体,这个媒体主要指四大门户以及各种地方网站那种新闻媒体哈。占比第二的UGC平台比如知乎等也很大。第三则是搜索词官网或垂直网站。至于电商这个说一下,因为是行业不同,有些没有这个哈。
所以我们得出结论,要做好DeepSeek的AI搜索优化,主要做好媒体、UGC为主就可以了,当然官网也要发。具体怎么布局SEO搜索关键词之类,看我公众号历史文章有写哈,后续也会慢慢分享出来,不在本文讨论。
2、豆包 AI生成内容信息采集主要来源及占比参考

如图,豆包主要信息采集来源是字节系自己产品(抖音短视频,抖音百科,头条等),另外就是新闻媒体上发的,第三则是官网及其它。占比如图,这里不再详说了。这个也是某个行业哈,其它你可以搜索自己试试。
3、Kimi AI生成内容信息采集主要来源及占比参考

如图,KIMI有意思,70%的内容来源UGC,尤其你看那个知乎占比很大啊,哈哈哈。
为什么呢,你像kimi这类AI大模型平台,跟deepseek一样,他们是没有像百度、腾讯,抖音有自己内容生态源哈。话说回来,知乎也是一个知识宝库呢,哈哈哈。
虽然知乎也有自己的AI大模型【知乎直答】如图,但它的影响力,就如知乎在当下互联网的现状一样,有心无力的,可能比某度还尴尬,唉。

4、百度AI搜索、文心一言 AI生成内容信息采集主要来源及占比参考
百度AI搜索、文心一言,其实这是两个渠道。文心一言是百度AI大模型产品,有网页版,也有APP,APP叫文小言。而百度AI搜索是百度搜索里面AI搜索。虽然跟文心一言模型一致,同时还结合了deepseek的哈,如图。

所以参考百度文心一言的,其实是一样的。主要内容及来源占比如图,参考

所以如果我们要做百度AI搜索或文心一言,主要做百度产品,比如百家号,百科,以及像新媒发软文,以及垂直官网等就可以了。
5、腾讯元宝 AI生成内容信息采集主要来源及占比参考
腾讯元宝AI生成内容信息采集主要来源就是微信生态内容,如公众号文章,视频号内容等,再加上其它新闻媒体,网站内容等,如图。

如果说占比的话,公众号文章占比应该要到50%左右哈。
如果想知道在元宝或微信搜一搜里这个词流量大概有多少,可以看微信指数或腾讯广告里数据。
6、通义(通义千问)、夸克AI生成内容信息采集主要来源及占比参考

如图,通义AI生成内容信息采集主要来源是各大新闻媒体平台(包含自媒体)比如网易号,腾讯企鹅号,搜狐网,新浪财经等,这类占比60%以上,其它就是官网之类。
当然,如果你搜索不同的词,比如电商类的之类,会来自一些垂直网站,比如站长之家,什么值得买等。当然,大多数还是阿里生态内数据,最近主要在增加这块,比如夸克搜索等。
当然,夸克那个AI跟通义逻辑一样,大家也要重点关注哦,它可能是国内目前AI搜索领域访问量TOP哦,如图。

7、智谱清言 AI生成内容信息采集主要来源及占比参考
智谱数据来源开源模型(如ChatGLM)、合作企业数据(如金融、政务领域)。占比推测:开源数据占40%,合作数据占50%等。如图,

除了合作的以外,另外就是一些第三方自媒体平台。因为智谱在国内AI大模型C端用户认知里不大,所以很多企业没有关注,正常。比如拿你来说,你手机里有下这个APP吗?
8、天工AI AI生成内容信息采集主要来源及占比参考
这个天工AI也是一样,很多粉丝朋友可能第一次听说它吧?哈哈哈。它默认是联网的哈,如图。

话说它这整个智能体,没有积分还用不了,当然新用户还会送,这样它这个和之前爆火的manus有点像,不再是纯聊天大模型,更像是可以做任务的智能体了,你简单理解就是比大模型还进一步了。

当然这个渠道,以及智能体这种,我们后面再写。
今天这篇又快三千字了,希望看完对你做AI搜索优化或者GEO优化有一定帮助。
作者:白杨SEO 个人微信:baiyang2047
顶: 0 踩: 0相关阅读:
来源:卢松松博客 QQ/微信:13340454
 
相关文章阅读更多:人工智能AI 数据分析
- 2025-11-01 前CTO梁军把寒武纪告了,要赔43亿!芯片圈炸了
 - 2025-10-23 永别了:Claude和GPT!七牛云一次接入50+顶级AI模型
 - 2025-10-22 值得收藏:AI Agent干货资料
 - 2025-10-09 未来5年,中国AI的“大洗牌”和“内循环”
 - 2025-10-03 未来最牛的模式:一个人的公司
 - 2025-09-19 GEO被定义为“灰产”,说GEO就是AI投毒
 - 2025-09-06 美国AI公司封杀中国企业,腾讯、字节、阿里全中枪,绕道无门!
 - 2025-09-02 29岁中国工程师背叛马斯克,套现700万美元,偷走Grok代码投奔死对头!
 - 2025-09-01 AI市场越大,这类人会越来越难找工作!
 - 2025-08-29 “人工智能+”行动六大赛道的机会地图
 - 2025-08-27 钉钉十周年就这?AI壳子一套,老功能又炒冷饭
 - 2025-08-23 寒武纪的5000亿泡泡,快吹破了!
 - 2025-08-20 全球第一家GEO公司诞生!顶级风投押注GEO赛道
 - 2025-08-18 人类首届机器人运动会:跑歪了+撞人了+打哆嗦,但我却看到了中国智造的未来
 - 2021-09-08凡是在卢松松博客投稿的作者都有机会得到IT类图书哦!
 












发表感想加入微信群
点此登录松松云平台免费认证
南京晴安财税
物联网卡
跨境电商
百度指数提升
( 微信号 sotui2014 )RAKsmart站群服务器