电脑网络 手机数码 生活 游戏 体育运动 明星影音 休闲爱好 文化艺术 就业职场 教育科学 健康医疗 商业理财 情感家庭 地区 其他

百度等其他搜寻引擎爬虫爬取的网页原始码是?

时间:2022-11-24 20:41:20

拿大家最常用的chrome浏览器来看,网页查看原始码方式有二种

1.键盘Ctrl+U查看源代码:就是别人服务器发送到浏览器的原封不动的代码,也就是最原始的代码

2.键盘F12检查元素:看到的就是最终的html代码。即:源代码 + 网页js渲染

有些网页是Javascript渲染的技术建置,所以会有Ctrl+U查不到文字,而F12查的到内文

因此想问大家,百度爬虫的话,是爬取Ctrl+U还是F12的原始码?

最佳答案
  • 据我所知,百度的蜘蛛只能爬到静态内容的,如果是JS
  • 所以,就有 SEO 优化,比如 vue,react,就 SSR
相关推荐
  • 百度说吧是怎么做到让搜索引擎的爬虫爬不到的?
  • Java爬虫怎么调用百度搜索引擎呢?我对某些关键字的网页爬取...
  • 百度、google、搜搜等搜索引擎爬虫ip列表
  • 什么是搜索引擎爬虫?
  • 如何准确判断请求是搜索引擎爬虫发出的请求
  • 百度爬虫病毒是什么?怎样才能清除?
  • 网站内容是否为原创?百度是这样判断的
  • © 米让问答