robots.txt 指南--介绍 [翻译]

news/2024/7/7 7:32:11
原文: http://javascriptkit.com/howto/robots.shtml
译者:Tony Qu,BluePrint翻译团队

    有一种力量其实一直在渗入大量的网站和页面,我们通常看不到它们,而且它们通常也很蛮横,大部分人甚至不知道它的存在,大家不要误会,其实我说得是搜索引擎爬虫和机器人。每天,上百个这样的爬虫会出来对网站进行快速的搜索。不管是不是google打算对整个网络进行索引,还是spam机器人打算收集大量的 email地址,通常它们这样的寻找是漫无目的的。作为网站拥有者,我们可以通过一个叫做robots.txt的文件来控制哪些动作是机器人可以做的。

创建robots.txt文件
好,现在我们开始行动。创建一个叫robots.txt的文本文件,请确保它的文件名是正确的。该文件必须上传到在您的网站的根目录下,而不是二级目录下(例如,应该是http://www.mysite.com,而不是http: //www.mysite.com/stuff),只有满足以上两点,即文件名正确和路径正确,搜索引擎才会根据该文件中的规则工作,否则 robots.txt仅仅只是个常规文件而已,没有任何作用。

现在,你已经知道如果这个文件该如何命名,以及应该把它上传在何处,接下来你会学习在这个文件中键入命令,搜索引擎会遵循一个叫做“机器人排除协议”(Robots Exclusion Protocol)的协议。其实,它的格式很简单,并且能够满足大多数的控制需要。首先是一行USERAGENT用来识别爬虫类型,紧跟着的是一行或者多行DISALLOW,这些行是用来限制爬虫访问网站的一些部分的。

1) robots.txt基本设置
User - agent:  *
Disallow: 
/




http://www.niftyadmin.cn/n/3656315.html

相关文章

VS 调试技巧(下)

转载自:http://blog.jobbole.com/45447/ 我的上篇文章《Vistual Studio原生开发的10个调试技巧》引发了很多人的兴趣,所以我决定跟大家分享更多的调试技巧。接下来你又能看到一些对于原生应用程序的很有帮助的调试技巧(接着上一篇文章来编号…

汉子字符转换与截取

下面是几个有意思的函数,主要是用于存在汉字字符时的转换和截取功能,挺好用,在这里记录一下。 1、 复制代码代码如下: const char *str "test测试test"; while(*str) { //这里只需要判断第一个字节大于0x80就行了,前…

机器人的meta标记[翻译]

原文地址:http://javascriptkit.com/howto/robots2.shtml如果你的网站供应商禁止你上传robots.txt文件到根目录,或者你仅仅是希望部分定制搜索爬虫对于你网站上的一些页面的动作,有一个可以代替robot.txt的方法,那就是使用robots的…

getMetrics()和getReaMetrics()的区别

记录一次getMetrics的错误使用,一次填坑之旅。 ##个人案例 最近在做视频,结果发现手机视频传输到PC上总是有黑边(在图像的左右两侧),经过排查确认在屏幕录制的时候,图像已经存在黑边。 代码是使用android提…

XSLT元素参考[翻译]

原文地址:http://www.w3schools.com/xsl/xsl_w3celementref.asp译者:Tony QuXSLT Element参考W3C的XSLT 元素 (XSLT 1.0版本).XSLT元素Element列中的是属性,你可以通过超链接获得更多有关每个属性的有用信息NN: 表示Netscape的早期版本支持该…

TCP和UDP分片大小

#1、概述 首先要看TCP/IP协议,涉及到四层:链路层,网络层,传输层,应用层。    其中: 以太网(Ethernet)的数据帧在链路层    IP包在网络层    TCP或UDP包在传输层    TCP或UDP…

[荐]学习flash mx2004 action script 2.0的好书

Macromedia Flash MX Professional 2004应用开发清华大学出版社作者:Jeanette Stallons译者:王晖、张军等源代码下载地址:www.tupwk.com.cn本书与国内出的所有flash书不同,并非动画教材,而是一本编程教材,原…

ruby是什么

文章目录1 - Ruby是什么东东?2 - Ruby能干什么?给我看一些Ruby语言代码!1 - 打印3次“Hello, world!”2 - 计算“1 2 3 ... 100”3 - 简单的方法调用4 - 简单的Ruby类和它的调用3 - “Ruby”这个名字从何而来?4 - 我对Ruby的历…