网站优化过程中收录一直是一个不管是菜鸟还是老鸟都非常揪心的问题,收录尽管与网站排名没有直接关系,但是排名与收录的的关系总所周知,随着百度算法的不断更新,百度对于收录的准则也越来越高,如何做好收录成了不管是站长还是企业都非常关心的一个问题,接下来就来谈谈网站为什么不收录的问题。
一、是否知道这个页面的存在
对页面进行收录当然首先就必须要知道有这个页面,蜘蛛都不知道这个页面,谈何收录?这一点主要分为2大类:搜索引擎找不到网页入口和不让搜索引擎抓取。
1.搜索引擎找不到网页入口
很多时候不是你更新了文章搜索引擎就要来抓取收录的,要怎么让蜘蛛知道你的更新呢?除了有规律的更新,可以向百度站长平台主动提交URL或者是提交站点地图,也可以让搜索引擎被动收集,这就是通过外链让蜘蛛知道你的网页,还有很多时候蜘蛛来到了你的网站,却找不到你更新的链接,因为网站的链接结构做得太复杂或是内链结构差,以致搜索引擎在抓取时间类不会爬到网站深处的页面,这也造成蜘蛛不知道该页面的存在。所以不管怎么样,第一步我们要保证页面能被蜘蛛看到,关于这一点可以通过查看网站日志来判断蜘蛛是否来访过。
2.不让搜索引擎抓取
很多网站有意无意的直接在Robots文件屏蔽了百度或网站部分页面,却整天在找原因为什么蜘蛛不来抓取我的页面,这能怪百度吗?你都不让别人进门了,百度是怎么收录你的网页?所以有必要时常去检查一下网站robots文件是否正常。
二、是否可以正常的抓取
好了,蜘蛛发现了这个页面,也有权利抓取这个页面了,那能否正常抓取就是一个很大的问题,我们都知道蜘蛛抓取这个页面要从域名到DNS服务器再到网站空间,所以其中任何一个环节出现问题,蜘蛛都不能正常的抓取,首先域名需要备案,然后域名解析要正常,如果解析出现问题,域名是不能访问网站IP地址的,这个时候网站打不开,蜘蛛抓取不了页面。
在有就是经常提到的空间服务器了,服务器长期打不开那肯定是抓取不了的,这个大家都知道。并且如果服务器比较卡或者不稳定,就会影响蜘蛛的抓取,蜘蛛不能很好的去抓取页面或由于加载慢只抓取到网页一半,这就很大程度上影响了网站的收录。具体可以看《草根站长做SEO,如何选择域名和空间》
三、是否达到收录标准
很多人觉得蜘蛛抓取就代表着收录,其实这是错误的,蜘蛛访问网站抓取页面并不代表就要收录你的网页,页面被抓取后要进行对比筛选,符合要求的才会被收录,为什么有的页面会被收录后又被吐出来?就是因为蜘蛛在不停的过滤,这个我们先不谈。既然是符合要求才会收录,那收录标准到底是什么呢?
1.行业不同标准也不同
这个是显而易见的,新闻类网站肯定比一般企业站容易收录,而对于医疗、BC、成人用品等网站,标准肯定是更加严格,所以对于不同的行业,百度给予的收录标准也是不一样的。
2.不同的网站标准不同
百度有一个优先抓取的原则,对于绝大多数用户喜欢,权重高的网站收录得要快,就像新浪网、腾讯网收录得肯定要比一般网站要快,为什么?因为信任,这类网站本身就有其严格的过滤系统,在此类网站公布的内容百度基本是直接抓了就收,搜索引擎是互联网与用户的桥梁,它的目的就是给用户提供有价值的内容,你能为它提供良好的内容,它当然也会对你更好,这是互利的。所以搜索引擎不是做慈善,你的网站能给它什么?
3.主体收录标准
百度有一个收录标准值,对页面进行评分,满足评分收录,否则扔掉。这里在木木SEO百度网站综合得分算法一文中已经说过了,主要是从页面基础、站内、站外、用户四个方面进行评分,感兴趣的可以看一看,这里就简单谈一谈网站页面的内容,
(1)页面字数建议是在500-800字,内容健康良好,信息丰富;
(2)受众多: 文章要有一定得用户需求,也即用户检索需求的大小;
(3)时效性:写最新的东西用户和搜索引擎都喜欢
(4)稀缺性: 稀缺主要是描述页面在互联网中的独特性。稀缺不等于无重复,只有对于大量完全无增益的重复页面,我们才应该认为其稀缺度较低。
四、是否有干净的域名
刚说了百度的收录标准,其实这一点也属于一个特别的标准,域名不干净同样是影响网站收录的一个重要原因,这个不干净我们分为2种情况。第一种就是域名在购买之前就有人用过了,不仅使用了而且还是用废了,这样的域名背景就是不干净,这就相当于以前如果你去考警察,如果家里是黑帮世家,那肯定是会影响你的,这和百度的收录是一个道理,严重的甚至域名直接作废。
另一种情况是我们经常说的降权,网站被降权这段时间是百度的一个审核期,网站的内容就算满足了上面所说的3点也可能收录慢或者是不收录,这个就需要我们坚持了。有恒心,能再次获得百度的信赖就会收录正常。
五、是否达到收录最大限度
等级不同的网站总收录的最大限度不同,日收录限制也不同。在新浪上更新1万篇文章可能会收录90%,但是如果在你的企业站更新1w篇文章可能是只会收录几十篇。这就是因为新浪的等级比你的高。等级不等于权重,权重只是等级的一个部分,等级是网站的重要程度,就像我们一个网站中不同页面的重要程度不一样,而在整个互联网不同网站的重要程度也不一样。所以中小型网站不要为了有大量的收录不断的去大量更新文章,这样的做法是错误的。不同的行业的更新的频率和数量是不一样,娱乐新闻行业可能需要几分钟更新一次,但是小型企业站可以几天或者几周更新一次都没有关系。
同时不同网站总收录最大限度也不一样,一个中小型新站目前的权重是1或者没有权重,那么它的收录限制维持在几十、几百到一千的数量。如果你发现不管你怎么更新做原创高质量的内容收录也上不去,可能就是因为网站权重处于一个阶段达到了收录限制,所以收录不可能上去。就好比家里的猫长得再大食量也没有猪多,所以猪分配的食物就自然要比猫多了,如果网站要突破这个收录的限制就要在权重上上升一个等级。
好了,就写到这了,我们不建议刻意的去提升收录,因为收录不等于排名,收录也不会直接影响到网站排名,网站根据行业需求和用户需求有规律的更新就可以了,用户在进入你的网站之后不需要再进入其它网站补脑了,这说明你的网站内容满足了用户所有的需求。