有了CSS,我们不再需要用FONT标签或者透明的1pxGIF图片来控制标题,改变字体颜色,字体样式等等
准确的应当是
Disallow:/css/
Disallow:/cgi-bin/
Disallow:/images/
l行前有大批空格
比方写成
Disallow:/cgi-bin/
只管在尺度没有谈到这个,可是这类体例很简单出成绩。
l404重定向到别的一个页面:
当Robot会见良多没有设置robots.txt文件的站点时,会被主动404重定向到别的一个Html页面。这时候Robot经常会以处置robots.txt文件的体例处置这个Html页面文件。固然一样平常如许没有甚么成绩,可是最好能放一个空缺的robots.txt文件在站点根目次下。
l接纳年夜写。比方
USER-AGENT:EXCITE
DISALLOW:
固然尺度是没有巨细写的,可是目次和文件名应当小写:
user-agent:GoogleBot
disallow:
l语法中只要Disallow,没有Allow!
毛病的写法是:
User-agent:Baiduspider
Disallow:/john/
allow:/jane/
l健忘了斜杠/
毛病的写做:
User-agent:Baiduspider
Disallow:css
准确的应当是
User-agent:Baiduspider
Disallow:/css/
上面一个小工具专门反省robots.txt文件的无效性:
http://www.searchengineworld.com/cgi-bin/robotcheck.cgi</p>
[上一页123456789下一页
2、RobotsMETA标签
1、甚么是RobotsMETA标签
Robots.txt文件次要是限定全部站点大概目次的搜刮引擎会见情形,而RobotsMETA标签则次要是针对一个个详细的页面。和其他的META标签(如利用的言语、页面的形貌、关头词等)一样,RobotsMETA标签也是放在页面的<head></head>中,专门用来告知搜刮引擎ROBOTS怎样抓取该页的内容。详细的情势相似(见黑体部分):
<html>
<head>
<title>时期营销--收集营销专业流派</title>
<metaname="Robots"content="index,follow">
<metahttp-equiv="Content-Type"CONTENT="text/html;charset=gb2312">
<metaname="keywords"content="营销…">
<metaname="description"content="时期营销网是…">
<linkrel="stylesheet"href="/public/css.css"type="text/css">
</head>
<body>
…
</body>
</html>
[上一页123456789下一页
2、RobotsMETA标签的写法:
RobotsMETA标签中没有巨细写之分,name=”Robots”暗示一切的搜刮引擎,能够针对某个详细搜刮引擎写为name=”BaiduSpider”。content部分有四个指令选项:index、noindex、follow、nofollow,指令间以“,”分开。
INDEX指令告知搜刮呆板人抓取该页面;
FOLLOW指令暗示搜刮呆板人能够沿着该页面上的链接持续抓取下往;
RobotsMeta标签的缺省值是INDEX和FOLLOW,只要inktomi除外,关于它,缺省值是INDEX,NOFOLLOW。
如许,一共有四种组合:
<METANAME="ROBOTS"CONTENT="INDEX,FOLLOW">
<METANAME="ROBOTS"CONTENT="NOINDEX,FOLLOW">
<METANAME="ROBOTS"CONTENT="INDEX,NOFOLLOW">
<METANAME="ROBOTS"CONTENT="NOINDEX,NOFOLLOW">
个中
<METANAME="ROBOTS"CONTENT="INDEX,FOLLOW">能够写成
<METANAME="ROBOTS"CONTENT="ALL">;
<METANAME="ROBOTS"CONTENT="NOINDEX,NOFOLLOW">能够写成
<METANAME="ROBOTS"CONTENT="NONE">
必要注重的是:上述的robots.txt和RobotsMETA标签限定搜刮引擎呆板人(ROBOTS)抓取站点内容的举措只是一种划定规矩,必要搜刮引擎呆板人的共同才行,并非每一个ROBOTS都恪守的。
今朝看来,尽年夜多半的搜刮引擎呆板人都恪守robots.txt的划定规矩,而关于RobotsMETA标签,今朝撑持的其实不多,可是正在渐渐增添,如出名搜刮引擎GOOGLE就完整撑持,并且GOOGLE还增添了一个指令“archive”,能够限定GOOGLE是不是保存网页快照。比方:
<METANAME="googlebot"CONTENT="index,follow,noarchive">
暗示抓取该站点中页面并沿着页面中链接抓取,可是不在GOOLGE上保存该页面的网页快照。
[上一页123456789下一页
例子:
#robots,scram
User-agent:*
Disallow:/cgi-bin
Disallow:/TRANSCRIPTS
Disallow:/development
Disallow:/third
Disallow:/beta
Disallow:/java
Disallow:/shockwave
Disallow:/JOBS
Disallow:/pr
Disallow:/Interactive
Disallow:/alt_index.html
Disallow:/webmaster_logs
Disallo
上一页1234下一页
业界越来越关注DIV+CSS的标准化设计,大到各大门户网站,小到不计其数的个人网站。 |