曾让全球大面积「断网」的网站揭秘:AI 爬虫正在疯狂「掏空」互联网

AIGC动态4小时前发布 Si-Planet
66 0 0
曾让全球大面积「断网」的网站揭秘:AI 爬虫正在疯狂「掏空」互联网

 

文章摘要


【关 键 词】 AI爬虫网络流量数据安全搜索引擎互联网趋势

近年来,AI爬虫的崛起正在悄然改变互联网流量的分布格局。根据Cloudflare的2025年度报告,全球网络流量同比增长19%,但增长趋势呈现明显的阶段性特征。上半年流量相对平稳,而8月中旬后开始显著攀升,年底达到峰值。这一变化与生成式AI的普及密切相关,尤其是用户行为类AI爬取量增长了超过15倍,其中ChatGPT相关的流量从年初到年底翻了21倍多。

AI爬虫的竞争格局已初步形成三巨头垄断态势。Googlebot以绝对优势占据首位,其IPv4请求流量是第二名的四倍,同时承担了搜索引擎索引和AI模型训练的双重任务。OpenAI的GPTBot和Microsoft的Bingbot分列二、三位,但波动较大。值得注意的是,零售和计算机软件行业成为AI爬虫的主要目标,合计占比超过40%,这些领域的数据对AI训练具有较高价值。

网站所有者与AI爬虫之间的关系正变得日益紧张。通过对全球前1万家网站的分析发现,GPTBot、ClaudeBot等AI爬虫被「完全拉黑」的比例远高于传统搜索引擎爬虫。Cloudflare引入的「爬虫推荐比率」指标揭示了这一矛盾的根源:Anthropic的爬虫一度达到500,000:1的极端比例,意味着大量爬取行为几乎不带来任何实际流量。相比之下,传统搜索引擎如Google的比率维持在3:1到30:1之间,显示出更良性的生态关系。

在AI模型应用层面,内容创作需求占据主导地位。Workers AI平台的数据显示,文字生成任务以48.2%的占比成为最常用的AI功能,远超图像生成和语音识别。Meta的llama-3-8b-instruct模型最受欢迎,占平台总使用量的36.3%,反映出开源模型在开发者社区的广泛影响力。

移动设备市场呈现明显的区域分化特征。iOS设备在30个高收入国家/地区的流量占比超过50%,其中摩纳哥达到70%;而Android仍在175个国家/地区保持主导地位,在27个国家/地区的占比超过90%。浏览器市场竞争格局同样显现出设备依赖性,Safari在iOS设备上占据79%的份额,而Chrome在Android和Windows平台分别达到85%和69%的占有率。

2025年全球网络中断事件揭示出意想不到的主要成因。全年174起重大中断事件中,防范考试作弊导致的人为关网成为最常见原因,超过了自然灾害或基础设施故障。这一现象反映出,在技术快速发展的同时,社会管理措施正在产生前所未有的网络影响。

原文和模型


【原文链接】 阅读原文 [ 2320字 | 10分钟 ]
【原文作者】 硅星人Pro
【摘要模型】 deepseek/deepseek-v3-0324
【摘要评分】 ★★★★★

© 版权声明
“绘蛙”

相关文章

“讯飞星辰”

暂无评论

暂无评论...