robots文件的认知及了解robots文件的基本写法使用规则

robots文件一般在根目录下，每一条记录通过空行分开，在该文件中可以使用#进行注释，支持模糊匹配，该文件是区分大小写的但不严格，通常以一行或多行User-agent开始，后面加上若干Disallow和Allow。

网站建设哪家好，找成都创新互联公司！专注于网页设计、网站建设、微信开发、小程序制作、集团企业网站建设等服务项目。为回馈新老客户创新互联还提供了中原免费建站欢迎大家使用！

Disallow:该项的值用于描述不希望被访问的一组URL，这个值可以是一条完整的路径，也可以是路径的非空前缀。Allow:该项的值用于描述希望被访问的一组URL，这个值可以是一条完整的路径，也可以是路径的前缀。

值得提醒的是每个搜索引擎都协议文件的解读不一样，比如百度是支持”*”和”$”来模糊匹配url的。”*”匹配0或多个任意字符，”$”匹配行结束符。最重要的是这个语法是从上到下生效的，切记。

常见的用法在网上可以找到，这里就这儿工具说几个不常见的，但是有用的东西，你们可以举一反三。

屏蔽所jpg或png图片被抓取：Disallow:/*.jpg$ 或者Disallow:/*.png$

禁止抓取所有动态页面：

User-agent:*

Disallow:/*?*

只允许抓取html网页：

Allow:/*.html$

User-agent:*

Disallow:/

禁止抓取后台所有文件同时隐藏后台真实目录：

#就这儿注释：比如你后台目录名是htdoadmin

Disallow:/*doad*

同时这个文件也支持放入网站地图地址：

#就这儿工具注释：一般放在整体结尾

Sitemap: http://XXX.com/sitemap.xml

最后面填个坑吧：上面说这个文件语法是从上到下生效，你或者不明白。就这儿在此举例说明：

#就这儿工具注释：仅允许 Baiduspider访问您的网站

User-agent: Baiduspider

Allow:/

User-agent:*

Disallow:/

前2行允许了百度爬行，那么第3-4行即使屏蔽了所有引擎包括百度，依然是允许百度爬行的。你明白了吗？再补充一个例子吧：

User-agent:*

Allow:/nihao/qincai

Disallow:/nihao/

这个写法将会阻止爬行：http://baidu.com/nihao/abc或者http://baidu.com/nihao/

但不会阻止爬行：http://baidu.com/nihao/qincai123或者http://baidu.com/nihao/qincai/123

文章结尾问你一个问题，你可以迅速回答出来吗？请问robots.txt里出现disallow是对的吗？

网站栏目：robots文件的认知及了解robots文件的基本写法使用规则
本文路径：http://lszwz.com/article/eshod.html

其他资讯

售后响应及时

7×24小时客服热线

数据备份

更安全、更高效、更稳定

价格公道精准

项目经理精准报价不弄虚作假

合作无风险

重合同讲信誉，无效全额退款

乐山小谭建站工作室是一家专注从事于高品质视觉体验及互联网设计开发，乐山网站建设，乐山网站设计，乐山网页设计，乐山网站制作，品牌网站建设，营销网站建设，集团网站建设，企业网站建设，外贸网站建设，响应式网站建设，小程序开发，微信开发，企业形象设计，企业宣传视频等服务，小谭建站位于乐山市龙岗区大运软件小镇，小谭建站拥有经验丰富的高级网站建设工程师和一流的网页高端设计人员，具备各种规模与类型网站建设的雄厚实力，在网站建设领域树立了自己独特的设计风格。

友情链接交换友情链接

微信公众号二次开发航龙航空成都网站设计成都主机托管成都h5建站开发南宁旺客科技雅安服务器托管安卓开发域名申请网站建设公司

Copyright © 2022 青羊区小谭信息技术咨询服务工作室乐山建站工作室 All Rights Reserved 蜀ICP备2021004003号-25

Copyright © 2022 青羊区小谭信息技术咨询服务工作室乐山建站工作室

蜀ICP备2021004003号-25