python html5 bootstrap 视频教程

德云社区

 找回密码
 立即注册

QQ登录

只需一步,快速开始

查看: 4039|回复: 0

通用XML格式sitemap站点地图

[复制链接]

31

主题

31

帖子

163

积分

普通技工

Rank: 2

金钱
98
金币
3
威望
0
贡献
0
发表于 2015-4-9 04:39:51 | 显示全部楼层 |阅读模式
AI人工智能 语音助理 人工翻译 教程

sitemap 站点地图又称网站地图,是其中放置了网站需被搜索引擎抓取页面链接(注:不是所有页面)的文件。多数人在网站上找不到自己所需信息时,可能会将网站地图作为一种补救措施。搜索引擎蜘蛛非常喜欢sitemap网站地图。


sitemap可方便网站管理员通知搜索引擎,网站上有哪些网页可供抓取。最简单的sitemap形式是XML文件,可在其中列出网站的所有网址链接及关于每个网址链接的其他元数据(上次更新时间、更改频率、相对网站其他网址链接的优先级等),以便搜索引擎更智能地抓取网站。


sitemap网站地图是网站所有链接的容器。很多网站的连接层次较深,蜘蛛很难抓取到,网站地图可方便搜索引擎蜘蛛抓取网站页面;搜索引擎蜘蛛通过抓取网站页面,可清晰了解网站架构。网站地图一般存放在根目录下且名为sitemap,可为搜索引擎蜘蛛指路,增加网站重要内容页面的收录。网站地图是根据网站的结构、框架、内容,生成的导航网页文件。


sitemap网站地图对提高用户体验有好处:它们可为网站访问者指明方向,并帮助迷失的访问者找到他们想看的页面。对于SEO而言,网站地图好处更多:

01、为搜索引擎蜘蛛提供可浏览整个网站的链接,简单体现网站的整体框架;


02、为搜索引擎蜘蛛提供链接,指向动态页面或采用其他方法较难到达的页面;


03、作为潜在着陆页面,可为优化搜索流量;


04、如访问者试图访问网站域内并不存在的URL,那么这个访问者就会被转到“无法找到文件”的错误页面,而网站地图可作为该页面的“准”内容。


注意事项

01、搜索引擎每天让蜘蛛在互联网爬行来抓取页面,网站地图的作用就是给蜘蛛爬行构造一个方便快捷的通道;由于网站页面是一层一层链接的,其中可能存在死链接。如没有网站地图,蜘蛛爬行到某个页面就会因死链接爬行不了,那么就不能收录那些断链接的页面,更别说快速的收录了!


由于网站地图的主要目的是方便搜索引擎蜘蛛抓取。如网站地图存在死链或坏链,就会影响网站在搜索引擎中的网站权重;所以要仔细检查有无错误链接地址,提交前可通过站长工具,检查网站的链接是否有效。


02、网站地图的存在不仅满足了搜索引擎蜘蛛,更是方便了网站访客浏览网站;特别是门户型网站由于信息量太大,很多访客都是通过网站地图来寻找到自己需要的信息页面,这也能很好的提高用户体验度。


03、网站地图可提高链接页面权重,因网站地图是指向其他页面的链接,此时网站地图就给页面增加了导入链接。大家知道增加导入链接会影响页面权重,从而提高页面权重,页面权重的提高同时会提高页面的收录率。


04、网站地图不可出现重复链接,要采用标准W3C格式地图文件,布局要简洁,清晰,如地图是内容式地图,每页不要超过100个链接内容,采用分页形式逐一分开,这样方便搜索引擎蜘蛛逐页爬行。


05、建议经常更新网站地图,便于培养搜索引擎蜘蛛爬行频率。经常有新的地图内容生成,长期以来,蜘蛛就会更关注,培养蜘蛛爬行规则。这样网站内容能更快的被搜索引擎抓取收录,网站内容也可以早日被搜索引擎检索。


06、网站地图不仅是给搜索引擎看的,而SEO的根本目的也是方便浏览者;所以网站地图兼顾搜索引擎的同时最好兼顾浏览者。通常要为一个网站建3个网站地图:


sitemap.HTML 页面精美,简洁大方,可让浏览者方便地找到目标页面的同时心情愉悦。


sitemap.XML 会认真研究网站,把重要页面标注出来,把不需要纳入的页面加上NO FOLLOW,这样更有利于搜索引擎辨别。


robots.TXT 格式 yahoo 等搜索引擎比较认可,谷歌也有这个项目。另外请在 robots 文本里写好网站地图位置。

通用XML格式网站地图
<?xml version="1.0" encoding="UTF-8"?>
<!-- XML文件需采用utf-8编码 -->
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
<!-- Sitemap 0.90 是依据广泛采用的署名 - 相同方式共享创作共用许可 Attribution-ShareAlike Creative Commons License 条款提供的,受 Google、Yahoo!、Microsoft 在内众多家厂商支持。sitemap.xml 文件最多支持 50000 条记录。如网站链接少于50000,只需提交 sitemap.xml 文件就行;如链接超过50000,可制作sitemap.xml  索引文件。-->
  <url>
    <loc>网页地址</loc>
    <!-- 页面最后修改时间,也可为带时间戳的 2005-05-10T17:33:30+08:00 形式。-->
    <lastmod>2015-05-10</lastmod>
    <!-- 页面内容更新频率,可为 always, hourly, daily, weekly, monthly, yearly, never。注意:网络爬虫更多时候未必会抓取标记为“always”的页面。“never” 值应用来描述存档 URL。-->
    <changefreq>daily</changefreq>
    <!-- 相对于其他页面的优先级, 取值范围为 0.0 到 1.0。0.0 为最低优先级,默认优先级为 0.5。优先级是用来在您网站网页间进行选择时用的。把所有 URL 的优先级设为 1.0 没用,因为会考虑网站页面间的相对优先级具体是多少。 -->
    <priority>0.9</priority>
  </url>
</urlset>

版权声明:
本文为独家原创稿件,版权归 德云社区,未经许可不得转载;否则,将追究其法律责任。

AI人工智能 语音助理 人工翻译 教程
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|Sitemap|小黑屋|德云社区 |网站地图  

GMT+8, 2024-3-29 07:51 , Processed in 0.030066 second(s), 30 queries .

工业和信息化部: 粤ICP备14079481号-2

技术支持 乐数软件     版权所有 © 2014-2021 德云社区    

快速回复 返回顶部 返回列表