企业文化  |  资质证明  |  服务优势   
专业的网站建设.seo网站优化.网站制作公司.多年行业经验.过硬的技术实力.完善的售后服务体系.服务热线:010-58466602 13121509100
 
网站首页 > 信息中心 > 网站建设
  Website Construction

详谈robots.txt写法规则

搜索引擎robots.txt规则,是放置在网站根目录下robots.txt文本文件,在文件中可以设定搜索引擎蜘蛛爬行规则。设置搜索引擎蜘蛛Spider抓取内容规则。
首先要创建一个robots.txt文本文件,放置网站的根目录下,下面就开始编辑设置robots.txt协议文件:
①robots.txt允许所有搜索引擎蜘蛛抓取所以目录文件,如果文件无内容,也表示允许所有的蜘蛛访问,设置代码如下:
User-agent: *
Disallow:
或者
User-agent: *
Allow: /
②robots.txt禁止某个搜索引擎蜘蛛抓取目录文件,设置代码如下:
User-agent: Msnbot
Disallow: /
例如想禁止MSN的蜘蛛抓取就设为,Msnbot代表MSN的蜘蛛,如果想禁止其他搜索引擎就更换蜘蛛名字即可,其他蜘蛛名字如下:
百度的蜘蛛:baiduspider
Google的蜘蛛: Googlebot
腾讯Soso:Sosospider
Yahoo的蜘蛛:Yahoo Slurp
Msn的蜘蛛:Msnbot
Altavista的蜘蛛:Scooter
Lycos的蜘蛛: Lycos_Spider_(T-Rex)
③robots.txt禁止某个目录被搜索引擎蜘蛛抓取,设置代码如下:
User-agent: *
Disallow: /目录名字1/
Disallow: /目录名字2/
Disallow: /目录名字3/
把目录名字改为你想要禁止的目录即可禁止搜索引擎蜘蛛抓取,目录名字未写表示可以被搜索引擎抓取。
④robots.txt禁止某个目录被某个搜索引擎蜘蛛抓取,设置代码如下:
User-agent: 搜索引擎蜘蛛名字     说明(上面有说明蜘蛛的名字)
Disallow: /目录名字/              说明(这里设定禁止蜘蛛抓取的目录名称)
例如,想禁目Msn蜘蛛抓取admin文件夹,可以设代码如下:
User-agent: Msnbot
Disallow: /admin/
⑤robots.txt设定某种类型文件禁止被某个搜索引擎蜘蛛抓取,设置代码如下:
User-agent: * 
Disallow: /*.htm   说明(其中“.htm”,表示禁止搜索引擎蜘蛛抓取所有“htm”为后缀的文件)⑥robots.txt充许所有搜索引擎蜘蛛访问以某个扩展名为后缀的网页地址被抓取,设置代码如下:User-agent: * 
Allow: .htm$  说明(其中“.htm”,表示充许搜索引擎蜘蛛抓取所有“htm”为后缀的文件)
⑦robots.txt只充许某个搜索引擎蜘蛛抓取目录文件,设置代码如下:
User-agent: 搜索引擎蜘蛛名字     说明(上面有说明蜘蛛的名字)
Disallow:

上一条:网站通过W3C标准的条件 返回网站建设知识列表
下一条:网站的PV流量分析
联系方式
服务优势
网站建设 | 网站制作 | 网站优化 | 人才招聘 | 付款方式 | 网站源码 | 网站地图 | 公司简介 | 资质证明 | 服务流程 | 联系我们
服务范围:北京网站建设、网页制作、北京网站制作、网站优化、北京seo优化、网站推广、网站改版 以诚为本.以质求存.用户至上.携手共进!
客服热线:010-58466602 13121509100 Email:znzncn@163.com QQ:415902355 未经本公司授权严禁抄袭或冒用,违者追究法律责任! 京ICP备03029007