• 提交Sitemap工具可以向搜狗提交网站Sitemap文件,帮助搜狗spider抓取您的网站。目前Sitemap采用邀请制,您可在此工具下选择已验证的站点,并观察站点是否已被邀请。
  • Sitemap提交后,搜狗搜索会根据Sitemap了解网站中的网址及关于每个网址的其他元数据(上次更新的时间、更改的频率等)。
  • 1.sitemap采用邀请制当您的网站存在原创或不可替代内容或不能被搜狗spider正确抓取时,才会开通sitemap权限。若您的站点满足上述条件但并没有sitemap权限,可发送邮件至申请。
  • 2.提交sitemap仅支持txt、xml、xml一级索引三种格式文件。
  • 3.每个文件最多可包含 50,000 个网址,并且应小于10MB(10,485,760字节)。如果网站所包含的网址超过 50,000 个,请将列表分割成多个文本文件,多于5万个后会不再处理文件个数不得超过100个,即提交sitemap的url不超过5000,000条
  • 4.请您提供信息详情页,原创内容等优质、重要内容页面,我们会根据提交的url质量选择性收录优质网页
  • 5.对于搜索结果页,转载,动态加载的搜索结果页等页面我们不建议提交sitemap收录并且可能不收录。
  • 6.如果您通过sitemap提交有作弊嫌疑的url,搜狗将进行严厉的处罚措施并且取消sitemap权限。
  • 7.搜狗spider有自身的爬取规则,sitemap只是帮助搜狗spider更加智能地收录您的站点,即提交Sitemap并不直接影响网站收录,索引以及排名

步骤一Sitemap制作

  1. 一.xml格式

    <?xml version="1.0" encoding="utf-8"?>
    <!-- XML文件需以utf-8编码 -->
    <urlset>
      <url>
      <!-- 必填,是具体某个链接的定义入口,每一条数据都要用<url>和</url>包含在其中 -->
         <loc>http://www.yoursite.html/yoursite.html</loc>
         <!-- 必填,URL链接地址,长度不得超过256字节 -->
         <lastmod>2013-05-01</lastmod>
         <!-- 选填,该链接的最后更新时间 -->
         <changefreq>daily</changefreq>
         <!-- 选填,此链接可能会出现的更新频率,
         有效值为:always,hourly,daily,weekly,monthly,yearly,never -->
         <priority>0.8</priority>
         <!-- 选填,此链接相对于其他链接的优先权比值,定于0.0-1.0之间 -->
      </url>
      <!-- 另一条数据 -->
    </urlset>
    				
  2. 二.txt文本格式

    http://www.example1.com/111.html
    http://www.example2.com/222.html
    http://www.example3.com/333.html

    • 文本文件每行都必须有一个网址,网址中不能有换行,网址要完整,包括 http(s)://,且不包含除网址以外的信息,需使用UTF-8 编码或GBK编码。
  3. 三.Sitemap索引格式

    如需提交多个Sitemap文件,可使用Sitemap索引文件:

    <?xml version="1.0" encoding="UTF-8"?>
       <sitemapindex>
         <sitemap>
             <loc>http://www.example.com/1.xml</loc>
             <!-- 必填,识别Sitemap的位置 -->
             <lastmod>2013-05-01</lastmod>
             <!-- 选填,该链接的最后更新时间 -->
          </sitemap>
          <!-- 另一条数据 -->
       </sitemapindex>
    

步骤二配置sitemap文件

步骤三提交sitemap

步骤四观察状态


一.提交成功

  • 已提交:代表您的sitemap文件已提交成功,但文件尚未处理。
  • 等待:代表您的sitemap文件已解析完毕,等待抓取。
  • 正常:代表您的sitemap文件在抓取中。
  • 等待更新:代表您的sitemap文件已处理完毕,等待您文件中更新新链接。

二.提交失败

  • Sitemap文件地址无法访问,请确认提交的地址可正常访问。
  • Sitemap文件地址与提交站点不是包含关系,请确认提交的地址属于已验证的站点,并且文件放置在根目录下。
  • 相同的Sitemap文件地址已经添加过,请勿重新添加。
  • 提交的Sitemap格式不规范,请检查该数据格式,修改后重新提交。
  • 对Sitemap提交有其他问题?可以向提交反馈。
有用:428 阅读:19219
提交失败 关闭

您好,站点本周已提交抓取诊断200次,达到每周抓取诊断上限,已无剩余次数。请下周再提交,合理利用抓取诊断次数,谢谢您的配合!