深圳市博士通科技有限公司

2014年年中百度不收录新站风波的原因和解决方案

2014/7/1 16:27:54   阅读:8102    发布者:8102

  很多客户做的新站从六月份开始就一直不收录,在此亚网互联给大家说一下六月份新站不收录的原因和解决方法,这个问题会持续到七月份中旬。

一、百度6-7月不收录新站的原因:


  世界杯期 间BO CAI菠菜盛 行,又到了菠菜利益集团疯狂入侵和疯狂建站的时期,百度针对的策略就是延缓新站放出和打击被入侵的网站
  1.你的网站并不是没有被收录,而是被收录了被延缓放出了,等待世界杯结束,如果你的网站是合格的就会立即放出。
  在这里我主要说的是针对6-7月正常的网站而没被收录的网站,如果你的网站本身存在问题而导致没有被收录,那么你需要从根本找到原因并解决。后面我会详细的说一下原因和解决方法。
  在世界杯期间没有被收录的网站,我在此对各位站长说一下,你检查好你网站的基础问题,耐心等待即可。并不是其他原因导致你的网站不收录。

  2.在此提醒各位站长做好安全工作,世界杯期间,你的网站很容易被入侵导致降权。

二、网站首页不收录的几点问题

  1.网站模板是套用的模板,没有做任何的布局或者框架改动,很多网络公司为了省时、省力、省钱。直接给客户套用的模板。导致网络重复率过高,百度不喜欢重复率过高的东西。
  解决方法:
  在套用模板的基础上适当的改一下布局,稀释一下网络相似度,能提高收录的成功率。最好的解决方法就是人工设计网站架构。

  2.网站内容过少,网站刚刚制作出来就上线,百度蜘蛛来爬取之后发现没有任何有用的价值。
  解决方法:
  网站制作完先本地测试或者服务器**域名测试,测试无误后开始添加内容,最起码把内容填充满页面之后再解析域名上线,百度蜘蛛再来抓取能抓取到很多内容。能大大的提高收录几率。

  3.robots.txt设置的问题,robots设置了蜘蛛禁止爬取或者你的站内没有robots文件。
  解决方案:查看你站内是否有robots.txt文件,如果没有,那么你制作一个上传。网站必须要有robots文件。
  查看方法直接在你的域名后面输入:域名/robots.txt 能打开就是有,打不开就是没有。

  4.有的robots.txt自动屏蔽动态页面,你的内容是动态的所以导致不收录。
  解决方法:
  ①把你的网站生成静态页面,很多程序自带生成静态页面功能。例如:织梦
  ②把robots禁止抓取动态取消掉即可。

  常规robots.txt的相关写法
  User-agent: * 这里的*代表的所有的搜索引擎种类,*是一个通配符
  Disallow: /admin/ 这里定义是禁止爬寻admin目录下面的目录
  Disallow: /require/ 这里定义是禁止爬寻require目录下面的目录
  Disallow: /ABC/ 这里定义是禁止爬寻ABC目录下面的目录
  Disallow: /cgi-bin/*.htm 禁止访问/cgi-bin/目录下的所有以”.htm”为后缀的URL(包含子目录)。
  Disallow: /*?* 禁止访问网站中所有包含问号 (?) 的网址
  Disallow: /.jpg$ 禁止抓取网页所有的.jpg格式的图片
  Disallow:/ab/adc.html 禁止爬取ab文件夹下面的adc.html文件。
  Allow: /cgi-bin/ 这里定义是允许爬寻cgi-bin目录下面的目录
  Allow: /tmp 这里定义是允许爬寻tmp的整个目录
  Allow: .htm$ 仅允许访问以”.htm”为后缀的URL。
  Allow: .gif$ 允许抓取网页和gif格式图片
  Sitemap: 网站地图 告诉爬虫这个页面是网站地图

  5.你的内容违反百度规定,例如你的站是灰色行业或者黑色行业。百度当然不会让你收录的。
  解决方法:
  利用heimao技术从代码上骗过百度蜘蛛,认为你是正规行业,而客户访问的时候显示的是你要宣传的产品。

  6.以上五点是新站不收录的主要原因,还有很多次要原因是以下:
  ①服务器不稳定:这个不会是影响首页收录的主要因素,服务器不稳定会影响内页的收录。
  ②过多的js代码:百度不喜欢js代码,如果你站内js代码过多,又加上网站不是很讨人喜欢,那么恭喜你。怎么会给你收录。
  ③域名以前被K过:以前被K过的域名短期内是不会被收录的,注册购买域名的时候需谨慎。


三、网站内页不收录的原因和解决方法

  1.文章内容过少,随着做seo时间越来越长你会慢慢的发现,文章越长越容易收录。

  原因和解决方法:因为文章长会减少网络相似度,百度会判定你为原创的几率高。文章长说明内容丰富,不丰富几句就完事。

  在合理的情况下尽量的增加文章内容,但并不意味着是复制黏贴。

  2.在1的基础上增加内容的丰富度!如何增加呢?
  在文章里合理的穿插图片,所谓的图文并用,能大大提高文章的质量。切记:图片要标示一个和文章标题相似或者相关的alt。
  图片内容要和文章相关,不要随意穿插图片。

  3.网站架构问题,样板文字过多。
  用站长工具模拟蜘蛛搜索可以看出,百度对比的都是页面。
  由于页面本身架构和内容过多,会提高文章的相似度。对于你站内来说你更新的大部分文章百度会认为是一篇。因为相似度太高。
  4.直接抄袭
  很多人懒到了极致,抄袭文章都不带改的。甚至都没有阅读一遍,连别人的文章内有超链接、品牌词等一起抄袭了过来。
  不知道你这么做的意义何在?最起码给被抄袭的人带来了宣传。
  解决方法:
  ①复制的内容要走一遍txt,去掉相关的格式和链接。
  ②抄袭的文章要进行修饰修改,阅读一遍在原文章的基础上改的更利于阅读。
  ③干货暂时保密,随时会公开哦!

  5.网站层次问题
  由于你的网站层次太深,百度蜘蛛无法抓取到你的内容,既然抓取不到何来收录之说?
  解决方法:减少网站的层次,层次比较少又比较重要的内容在首页**一个入口。

  6.网站权重问题
  百度曾经说过第三方工具的权重不准,说明百度是有权重等级的,只是没有公布出来。所以权重越高越利于收录。
  解决方法:在优化过程中多多提高网站的权重。站得高才能尿的远。权重高了才是王道。

  7.外链
  不光你的首页需要外链,你的内页有的时候也需要外链
  给你内容适当的发布几个外链,能大大的提高该内容的收录率。

  8.空间不稳定、内部链接不合理。
  这两条是不收录的次要因素也是主要因素!因为你的空间非常不稳定,几乎打不开。那能收录就怪了