sitemap 站点地图又称网站地图,是其中放置了网站需被搜索引擎抓取页面链接(注:不是所有页面)的文件。多数人在网站上找不到自己所需信息时,可能会将网站地图作为一种补救措施。搜索引擎蜘蛛非常喜欢sitemap网站地图。
sitemap可方便网站管理员通知搜索引擎,网站上有哪些网页可供抓取。最简单的sitemap形式是XML文件,可在其中列出网站的所有网址链接及关于每个网址链接的其他元数据(上次更新时间、更改频率、相对网站其他网址链接的优先级等),以便搜索引擎更智能地抓取网站。
sitemap网站地图是网站所有链接的容器。很多网站的连接层次较深,蜘蛛很难抓取到,网站地图可方便搜索引擎蜘蛛抓取网站页面;搜索引擎蜘蛛通过抓取网站页面,可清晰了解网站架构。网站地图一般存放在根目录下且名为sitemap,可为搜索引擎蜘蛛指路,增加网站重要内容页面的收录。网站地图是根据网站的结构、框架、内容,生成的导航网页文件。
sitemap网站地图对提高用户体验有好处:它们可为网站访问者指明方向,并帮助迷失的访问者找到他们想看的页面。对于SEO而言,网站地图好处更多: 01、为搜索引擎蜘蛛提供可浏览整个网站的链接,简单体现网站的整体框架;
02、为搜索引擎蜘蛛提供链接,指向动态页面或采用其他方法较难到达的页面;
03、作为潜在着陆页面,可为优化搜索流量;
04、如访问者试图访问网站域内并不存在的URL,那么这个访问者就会被转到“无法找到文件”的错误页面,而网站地图可作为该页面的“准”内容。
注意事项01、搜索引擎每天让蜘蛛在互联网爬行来抓取页面,网站地图的作用就是给蜘蛛爬行构造一个方便快捷的通道;由于网站页面是一层一层链接的,其中可能存在死链接。如没有网站地图,蜘蛛爬行到某个页面就会因死链接爬行不了,那么就不能收录那些断链接的页面,更别说快速的收录了!
由于网站地图的主要目的是方便搜索引擎蜘蛛抓取。如网站地图存在死链或坏链,就会影响网站在搜索引擎中的网站权重;所以要仔细检查有无错误链接地址,提交前可通过站长工具,检查网站的链接是否有效。
02、网站地图的存在不仅满足了搜索引擎蜘蛛,更是方便了网站访客浏览网站;特别是门户型网站由于信息量太大,很多访客都是通过网站地图来寻找到自己需要的信息页面,这也能很好的提高用户体验度。
03、网站地图可提高链接页面权重,因网站地图是指向其他页面的链接,此时网站地图就给页面增加了导入链接。大家知道增加导入链接会影响页面权重,从而提高页面权重,页面权重的提高同时会提高页面的收录率。
04、网站地图不可出现重复链接,要采用标准W3C格式地图文件,布局要简洁,清晰,如地图是内容式地图,每页不要超过100个链接内容,采用分页形式逐一分开,这样方便搜索引擎蜘蛛逐页爬行。
05、建议经常更新网站地图,便于培养搜索引擎蜘蛛爬行频率。经常有新的地图内容生成,长期以来,蜘蛛就会更关注,培养蜘蛛爬行规则。这样网站内容能更快的被搜索引擎抓取收录,网站内容也可以早日被搜索引擎检索。
06、网站地图不仅是给搜索引擎看的,而SEO的根本目的也是方便浏览者;所以网站地图兼顾搜索引擎的同时最好兼顾浏览者。通常要为一个网站建3个网站地图:
sitemap.HTML 页面精美,简洁大方,可让浏览者方便地找到目标页面的同时心情愉悦。
sitemap.XML 会认真研究网站,把重要页面标注出来,把不需要纳入的页面加上NO FOLLOW,这样更有利于搜索引擎辨别。
robots.TXT 格式 yahoo 等搜索引擎比较认可,谷歌也有这个项目。另外请在 robots 文本里写好网站地图位置。
构建技巧
sitemap网站地图的作用非常明显,它不仅可满足用户的访问需求,还可取悦搜索引擎蜘蛛。sitemap在设计上存在一些技巧,可让用户和蜘蛛都获得满意: 01、sitemap网站地图应包含最重要页面 如 sitemap网站地图包含太多链接,人们在浏览时会迷失。因此,如网站页面总数超过100,就需选出最重要页面。建议把以下这些页面放到网站地图中: 1)产品分类页面;
2)主要产品页面;
3)FAQ和帮助页面;
4)位于转化路径上的所有关键页面,访问者将从着陆页面出发,然后沿着这些页面实现转化;
5)访问量最大的前10个页面;
6)如果有站内搜索引擎的话,就挑选出从该搜索引擎出发点击次数最高的那些页面。
02、sitemap网站地图布局一定要简洁,所有链接都须是标准HTML文件,且要尽可能多的包含关键字 不要将图片用作sitemap网站地图链接,因为蜘蛛不能跟随。一定要用标准HTML文件做链接,链接中要包括尽可能多的目标关键字。比如:可使用“无公害除草剂、杀虫剂和杀菌剂”来代替“我们的产品”为标题。
03、尽量在sitemap站点地图上增加文本说明 增加文本会给蜘蛛提供更有索引价值的内容,及有关内容的更多线索。
04、在每页面内放置sitemap网站地图链接 用户一般期望每页面底部都有一指向网站地图的链接,可充分利用人们的这一习惯。如网站有搜索栏,可在搜索栏附近增加一指向网站地图的链接,甚至可在搜索结果页的某固定位置放置网站地图链接。
05、确保sitemap网站地图每一链接正确、有效 如 sitemap 网站地图里出现的链接是断链或死链,对搜索引擎的影响是非常不好的。如链接较少,可把所有链接都点一遍,以确保每一链接有效。如链接较多,可用链接检查工具检测。
06、可把sitemap写进robots.txt 引擎爬虫抓取网页时,会先查看robots.txt;如把sitemap写进robots.txt,那么在效率上会大大提高,从而获得搜索引擎的好感。
生成提交
网上有很多sitemap网站地图生成方法,比如在线生成、软件生成等。可把sitemap网站地图提交给各大搜索引擎,使搜索引擎更好的对网站页面进行收录,也可通过robots.txt来告诉搜索引擎地图的位置。将制作好的网站地图上传至网站根目录下,最关键的是把网站地图链接地址加入robots文件,及做好网站地图页面方便蜘蛛抓取,一般可把网站地图放在页眉、页脚位置。
01、普通HTML格式网站地图 目的是帮助用户整体把握站点。HTML格式的网站地图根据网站结构特征制定,尽可能把网站功能结构、服务内容富有条理地列出。一般来说,网站首页有一个链接指向该格式的网站地图。
02、XML sitemap通常称sitemap sitemap是网站上的链接列表。制作sitemap,并提交给搜索引擎可使网站的内容完全被收录,包括那些隐藏得比较深的页面。这是一种网站与搜索引擎对话的好方式。
03、搜索引擎可识别的地图 Google、雅虎、微软都支持称为xml的网站地图(xml Sitemaps)协议,而百度Sitemap是指百度支持的收录标准,百度在原有协议上做出了扩展。百度sitemap的作用是通过Sitemap告诉百度蜘蛛全面的站点链接,优化自己的网站。百度Sitemap分为三种格式:txt文本格式、xml格式、Sitemap索引格式。
通用XML格式网站地图
<?xml version="1.0" encoding="UTF-8"?>
<!-- XML文件需采用utf-8编码 -->
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
<!-- Sitemap 0.90 是依据广泛采用的署名 - 相同方式共享创作共用许可 Attribution-ShareAlike Creative Commons License 条款提供的,受 Google、Yahoo!、Microsoft 在内众多家厂商支持。sitemap.xml 文件最多支持 50000 条记录。如网站链接少于50000,只需提交 sitemap.xml 文件就行;如链接超过50000,可制作sitemap.xml 索引文件。-->
<url>
<loc>网页地址</loc>
<!-- 页面最后修改时间,也可为带时间戳的 2005-05-10T17:33:30+08:00 形式。-->
<lastmod>2015-05-10</lastmod>
<!-- 页面内容更新频率,可为 always, hourly, daily, weekly, monthly, yearly, never。注意:网络爬虫更多时候未必会抓取标记为“always”的页面。“never” 值应用来描述存档 URL。-->
<changefreq>daily</changefreq>
<!-- 相对于其他页面的优先级, 取值范围为 0.0 到 1.0。0.0 为最低优先级,默认优先级为 0.5。优先级是用来在您网站网页间进行选择时用的。把所有 URL 的优先级设为 1.0 没用,因为会考虑网站页面间的相对优先级具体是多少。 -->
<priority>0.9</priority>
</url>
</urlset>
版权声明:
本文为独家原创稿件,版权归 德云社区,未经许可不得转载;否则,将追究其法律责任。
|