|
Sitemap.xml是google发明的的,也就是网站地图,不过这个网站地图是用xml写的,而且要按google的标准来写,并且要将写出来的这个文件sitemap.xml上传到自己的服务器空间中去。目前,Google, Yahoo, MSN都已经声明支持这种格式,Baidu还没有声明支持,但估计走这一步也是大势所趋。这将是向众多搜索引擎提供你网站信息的一种很好的方法。
提交sitemap一是有利于搜索抓取一些正常抓取过程中无法抓取的网址,比如动态网页,包含大量AJAX的网页或者flash的页面。二是为搜索蜘蛛指明“工作方向”。Sitemap就是你网站上页面的列表,googlebot就按照这个去一个个的抓取收录页面,显然比它自己去找会效率高,而且要全。Google网站上有完整的关于sitemap.xml的详细说明: http://www.google.com/support/webmasters/bin/answer.py?answer=40318&hl=zh_CN
但很多站长看后仍然不会操作,下面这个教程就是手把手教会你创建Sitemap.xml:
Sitemap.XML 的完整格式如下:
<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.google.com/schemas/sitemap/0.84" >
<url>
<loc>http://www.hao51xx.com/default.asp</loc>
<lastmod>2008-07-17</lastmod>
<changefreq>daily</changefreq>
<priority>1.0</priority>
</url>
<url>
<loc> http://www.hao51xx.com/search2.asp?id=32003044&sq=1</loc>
<lastmod>2008-07-17</lastmod>
<changefreq>weekly</changefreq>
<priority>0.9</priority>
</url>
…
…
</urlset>
下面,对以上标签分别加以解释
<!--[if !supportLists]-->a) <!--[endif]--><?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.google.com/schemas/sitemap/0.84" >
这两行就相当于网页文件中的<html>标签一样的作用。不必管这两行什么意思,照抄即可。
切记:一个字符也不能错,即使多一个空格,google网站采集时也会报错。另外,千万别忘了在文件的末尾加上</urlset>标签。
<!--[if !supportLists]-->
b) url:每个标签包含一个网页地址,是以下标签的父标签。
c) http://www.hao51xx.com/default.asp
这里是页面链接地址,也就是你希望蜘蛛访问的地址。
切记:在地址中出现的某些特殊字符需要使用转义字符,否则,google也会报错。最典型的就是 & 号,经常在动态网址中出现,在提交地址中必须写成 & 如:提交http://www.hao51xx.com/search2.asp?id=32003044&sq=1,google管理员工具就会报错,而改为 http://www.hao51xx.com/search2.asp?id=32003044&sq=1提交后就没有问题了。我看到网上有人说sitemap.xml只能提交一个参数的网页的说法,其实多半是因为没有使用转义字符而导致出错的。其他的转义字符就不一一列出了,大家可以在网上查。