外链吧

 找回密码
立即注册
  • 513排名系统 广告招租 广告招租 新闻稿发布
查看: 64|回复: 0

分析:蜘蛛抓取但是收录不放出来为什么2021/4/12 7:28:16

[复制链接]

19万

主题

19万

帖子

409

积分

积分
409
发表于 2021-4-12 07:28:17 | 显示全部楼层 |阅读模式

1、爬取和收录的关系:成都seo




爬取和收录并不是包含关系,他们两个是搜索引擎工作的环节,蜘蛛爬取页面后放入临时数据库,等内容通过审查后背放出就形成了收录。所以这两个环节是前后关系,但是没有必然的联系。







2蜘蛛抓取页面的过程:



第一阶段:大小通吃
搜索引擎蜘蛛过来抓取时,就需要对的URL进行一个统一的抓取,也就是站长常说的大小通吃的情况。搜索引擎蜘蛛对页中出现地链接,都会逐一加入到待抓取URL中,机械性的将新抓取的页中的URL提取出来。这对于很多的站点来说,是比较好的情况。搜索引擎蜘蛛过来抓取时,站长可以通过日志有一个清楚的记录。站长可以通过日志分析优化的基本情况,这仅仅是第一阶段。


第二阶段:页评级
搜索引擎蜘蛛对的页面进行抓取以后,就需要对的页面进行评级。PR是一种著名的链接分析算法,可以用来衡量页的重要性,很自然的,站长可以用PR的思路来对URL进行排序。搜索引擎蜘蛛抓取页面后,会对的页面进行下载。但PR是个全局性算法,也就是当所有页有下载完成后,其计算结果才是可靠的。对于中小来讲,服务器如果质量不好,如果在抓取过程中,只看到部分内容,在抓取阶段是无法获得可靠的PR得分。



3、蜘蛛爬取成功却不放出来的原因:



蜘蛛爬取后会将页面放入到临时数据库,搜索引擎再对临时数据库中的内容进行审查,将优质的内容放出并建立索引。所以并不是说爬取就会被收录,还需要内容质量过关才能被放出来并建立索引。不同的蜘蛛抓取的页面评测也不一样,有的是低权重的蜘蛛,有的是高权重的蜘蛛和抓取待定的蜘蛛,这个可以百度搜下各种蜘蛛的情况,来做出各种应对情况




        正常情况下提交后次日,会放出一个主页的快照。再接下来的时间内,会不断的收录索引内容页,并持续的放出。这个过程维护一月、二月、或者是三月,时间不等。如果已经有首页放出,说明百度蜘蛛已经有来抓取过,只是内容还没有放出来,多等待些时间即可。如果在等待收录放出的时间阶段不要做任何大的发动。比如说 修改标题、修改 等。否则会延长放出的时间,周期也会变长。

        其次,如果内容和首页都没有放出来,就需要重新向百度提交,通知百度蜘蛛来抓取的内容,最好是提交个地图,手动提交一下。
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

关闭

站长推荐上一条 /1 下一条

  • 外链吧 | 五金修配网 | 免费优化 | 财通街 | 全能百科 | 链接购买
  • 在线咨询
  • 网站优化

  • 正规网站优化群

    QQ|手机版|小黑屋|外链吧|外链吧 ( 豫ICP备17032527号-5 )|网站地图|网站地图

    GMT+8, 2021-10-22 18:33 , Processed in 0.047846 second(s), 21 queries .

    快速回复 返回顶部 返回列表