Sitemap(即站點(diǎn)地圖)就是您網(wǎng)站上各網(wǎng)頁(yè)的列表。創(chuàng)建并提交Sitemap有助于百度發(fā)現(xiàn)并了解您網(wǎng)站上的所有網(wǎng)頁(yè)。您還可以使用Sitemap提供有關(guān)您網(wǎng)站的其他信息,如上次更新日期、Sitemap文件的更新頻率等,供百度Spider參考。
百度對(duì)已提交的數(shù)據(jù),不保證一定會(huì)抓取及索引所有網(wǎng)址。但是,我們會(huì)使用Sitemap中的數(shù)據(jù)來(lái)了解網(wǎng)站的結(jié)構(gòu)等信息,這樣可以幫助我們改進(jìn)抓取策略,并在日后能更好地對(duì)網(wǎng)站進(jìn)行抓取。
此外,Sitemap 與搜索排名沒(méi)有關(guān)系。
百度Sitemap協(xié)議支持文本格式和xml格式,可以根據(jù)自己情況來(lái)選擇任意一種格式組織sitemap。具體格式說(shuō)明及示例如下:
1.第一種格式樣例:txt文本格式
在一個(gè)txt文本列明需要向百度提交的鏈接地址,將txt文本文件通過(guò)搜索資源平臺(tái)進(jìn)行提交
http://www.example.com/repaste/101562698_5230191316.html
http://www.example.com/repaste/101586283_5230215075.html
http://www.example.com/repaste/101639435_5230310576.html
此文本文件需要遵循以下指南:
· 文本文件每行都必須有一個(gè)網(wǎng)址。網(wǎng)址中不能有換行。
· 不應(yīng)包含網(wǎng)址列表以外的任何信息。
· 您必須書寫完整的網(wǎng)址,包括 http。
· 每個(gè)文本文件最多可包含 50,000 個(gè)網(wǎng)址,并且應(yīng)小于10MB(10,485,760字節(jié))。如果網(wǎng)站所包含的網(wǎng)址超過(guò) 50,000 個(gè),則可將列表分割成多個(gè)文本文件,然后分別添加每個(gè)文件。
· 文本文件需使用 UTF-8 編碼或GBK編碼。
2.第二種格式樣例:xml格式
單個(gè)xml數(shù)據(jù)格式如下:
<?xml version="1.0" encoding="utf-8"?>
<!-- XML文件需以u(píng)tf-8編碼-->
<urlset>
<!--必填標(biāo)簽-->
<url>
<!--必填標(biāo)簽,這是具體某一個(gè)鏈接的定義入口,每一條數(shù)據(jù)都要用<url>和</url>包含在里面,這是必須的 -->
<loc>http://www.yoursite.com/yoursite.html</loc>
<!--必填,URL鏈接地址,長(zhǎng)度不得超過(guò)256字節(jié)-->
<lastmod>2009-12-14</lastmod>
<!--可以不提交該標(biāo)簽,用來(lái)指定該鏈接的最后更新時(shí)間-->
<changefreq>daily</changefreq>
<!--可以不提交該標(biāo)簽,用這個(gè)標(biāo)簽告訴此鏈接可能會(huì)出現(xiàn)的更新頻率 -->
<priority>0.8</priority>
<!--可以不提交該標(biāo)簽,用來(lái)指定此鏈接相對(duì)于其他鏈接的優(yōu)先權(quán)比值,此值定于0.0-1.0之間-->
</url>
<url>
<loc>http://www.yoursite.com/yoursite2.html</loc>
<lastmod>2010-05-01</lastmod>
<changefreq>daily</changefreq>
<priority>0.8</priority>
</url>
</urlset>
上述Sitemap向百度提交了一個(gè)url:http://www.yoursite.com/yoursite.html
若有多條url,按照上述格式重復(fù)<url></url>之間的片斷,列明所有url地址,打包到一個(gè)xml文件,向搜索資源平臺(tái)進(jìn)行提交。
創(chuàng)建Sitemap時(shí)有哪些注意事項(xiàng)?
第一,一個(gè)Sitemap文件包含的網(wǎng)址不得超過(guò) 5 萬(wàn)個(gè),且文件大小不得超過(guò) 10 MB。如果您的Sitemap超過(guò)了這些限值,請(qǐng)將其拆分為幾個(gè)小的Sitemap。這些限制條件有助于確保您的網(wǎng)絡(luò)服務(wù)器不會(huì)因提供大文件而超載。
第二,一個(gè)站點(diǎn)支持提交的sitemap文件個(gè)數(shù)必須小于5萬(wàn)個(gè),多于5萬(wàn)個(gè)后會(huì)不再處理,并顯示“鏈接數(shù)超”的提示。
第三,如果驗(yàn)證了網(wǎng)站的主域,那么Sitemap文件中可包含該網(wǎng)站主域下的所有網(wǎng)址。
第四,搜索資源平臺(tái)sitemap文件提交已不再支持索引型文件形式,歷史提交的索引型文件已不再進(jìn)行抓取,建議站長(zhǎng)及時(shí)刪除,重新進(jìn)行資源提交。
如何提交Sitemap
第一步,將需提交的網(wǎng)頁(yè)列表制作成一個(gè)Sitemap文件,文件格式請(qǐng)閱讀百度Sitemap協(xié)議都支持哪些格式。
第二步,將Sitemap文件放置在網(wǎng)站目錄下。比如您的網(wǎng)站為example.com,您已制作了一個(gè)sitemap_example.xml的Sitemap文件,將sitemap_example.xml上傳至網(wǎng)站根目錄即example.com/sitemap_example.xml
第三步,登錄百度搜索資源平臺(tái),確保提交Sitemap數(shù)據(jù)的網(wǎng)站已驗(yàn)證歸屬。
第四步,進(jìn)入Sitemap工具,點(diǎn)擊“添加新數(shù)據(jù)”,文件類型選擇“URL列表”,填寫抓取周期和Sitemap文件地址
最后,提交完之后,可在Sitemap列表里看到提交的Sitemap文件,如果Sitemap文件里面有新的網(wǎng)站鏈接,可以選擇文件后,點(diǎn)擊更新所選,即對(duì)更新的網(wǎng)站鏈接進(jìn)行了提交。
什么是移動(dòng)Sitemap協(xié)議,如何提交移動(dòng)Sitemap協(xié)議
百度推出了移動(dòng)Sitemap協(xié)議,用于將網(wǎng)址提交給移動(dòng)搜索收錄。百度移動(dòng)Sitemap協(xié)議是在標(biāo)準(zhǔn)Sitemap協(xié)議基礎(chǔ)上制定的,增加了<mobile:mobile/>標(biāo)簽,它有四種取值:
<mobile:mobile/> :移動(dòng)網(wǎng)頁(yè)
<mobile:mobile type="mobile"/> :移動(dòng)網(wǎng)頁(yè)
<mobile:mobile type="pc,mobile"/>:自適應(yīng)網(wǎng)頁(yè)
<mobile:mobile type="htmladapt"/>:代碼適配
無(wú)該上述標(biāo)簽表示為PC網(wǎng)頁(yè)
下方樣例相當(dāng)于向百度移動(dòng)搜索提交了一個(gè)移動(dòng)網(wǎng)頁(yè):http://m.example.com/index.html,向PC搜索提交了一個(gè)傳統(tǒng)網(wǎng)頁(yè):http://www.example.com/index.html,同時(shí)向移動(dòng)搜索和PC搜索提交了一個(gè)自適配網(wǎng)頁(yè)http://www.example.com/autoadapt.html:
<?xml version="1.0" encoding="UTF-8" ?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"
xmlns:mobile="http://www.baidu.com/schemas/sitemap-mobile/1/">
<url>
<loc>http://m.example.com/index.html</loc>
<mobile:mobile type="mobile"/>
<lastmod>2009-12-14</lastmod>
<changefreq>daily</changefreq>
<priority>0.8</priority>
</url>
<url>
<loc>http://www.example.com/index.html</loc>
<lastmod>2009-12-14</lastmod>
<changefreq>daily</changefreq>
<priority>0.8</priority>
</url>
<url>
<loc>http://www.example.com/autoadapt.html</loc>
<mobile:mobile type="pc,mobile"/>
<lastmod>2009-12-14</lastmod>
<changefreq>daily</changefreq>
<priority>0.8</priority>
</url>
<url>
<loc>http://www.example.com/htmladapt.html</loc>
<mobile:mobile type="htmladapt"/>
<lastmod>2009-12-14</lastmod>
<changefreq>daily</changefreq>
<priority>0.8</priority>
</url>
</urlset>
按照移動(dòng)Sitemap協(xié)議做好Sitemap后,在Sitemap工具點(diǎn)擊添加新數(shù)據(jù)提交,與提交普通Sitemap方式一致。
我提交時(shí)填寫的周期是什么含義?
百度Spider會(huì)參考設(shè)置周期抓取Sitemap文件,因此請(qǐng)根據(jù)Sitemap文件內(nèi)容的更新(比如增加新url)來(lái)設(shè)置。請(qǐng)注意若url不變而僅是url對(duì)應(yīng)的頁(yè)面內(nèi)容更新(比如論壇帖子頁(yè)有新回復(fù)內(nèi)容),不在此更新范圍內(nèi)。Sitemap工具不能解決頁(yè)面更新問(wèn)題。
Sitemap提交后,多久能被百度處理?
Sitemap數(shù)據(jù)提交后,一般在1小時(shí)內(nèi)百度會(huì)開始處理。在以后的調(diào)度抓取中,如果您的sitemap支持etag,我們會(huì)更頻繁抓取sitemap文件,從而及時(shí)發(fā)現(xiàn)內(nèi)容更新;否則抓取的周期會(huì)比較長(zhǎng)。
提交的Sitemap都會(huì)被百度抓取并收錄嗎?
百度對(duì)已提交的數(shù)據(jù),不保證一定會(huì)抓取及收錄所有網(wǎng)址。是否收錄與頁(yè)面質(zhì)量相關(guān)。
XML格式的 Sitemap 中,“priority”提示會(huì)影響我的網(wǎng)頁(yè)在搜索結(jié)果中的排名嗎?
不會(huì)。Sitemap 中的“priority”提示只是說(shuō)明該網(wǎng)址相對(duì)于您自己網(wǎng)站上其他網(wǎng)址的重要性,并不會(huì)影響網(wǎng)頁(yè)在搜索結(jié)果中的排名。
網(wǎng)址在 Sitemap 中的位置是否會(huì)影響它的使用?
不會(huì)。網(wǎng)址在 Sitemap 中的位置并不會(huì)影響百度對(duì)它的識(shí)別或使用方式。
Sitemap中提交的url能否包含中文?
因?yàn)檗D(zhuǎn)碼問(wèn)題建議最好不要包含中文。
什么是自動(dòng)推送工具?自動(dòng)推送工具解決了什么問(wèn)題?
自動(dòng)推送JS代碼是百度搜索資源平臺(tái)最新推出的輕量級(jí)鏈接提交組件,站長(zhǎng)只需將自動(dòng)推送的JS代碼放置在站點(diǎn)每一個(gè)頁(yè)面源代碼中,當(dāng)頁(yè)面被訪問(wèn)時(shí),頁(yè)面鏈接會(huì)自動(dòng)推送給百度,有利于新頁(yè)面更快被百度發(fā)現(xiàn)。
為了更快速的發(fā)現(xiàn)站點(diǎn)每天產(chǎn)生的最新內(nèi)容,百度搜索資源平臺(tái)推出API推送工具,產(chǎn)品上線后,部分站長(zhǎng)反饋使用API推送方式的技術(shù)門檻較高,于是我們順勢(shì)推出更低成本的JS自動(dòng)推送工具。一步安裝便可實(shí)現(xiàn)頁(yè)面自動(dòng)推送,低成本,高收益。
自動(dòng)推送代碼如何安裝使用?
站長(zhǎng)需要在每個(gè)頁(yè)面的HTML代碼中包含以下自動(dòng)推送JS代碼:
<script>
(function(){
var bp = document.createElement('script');
var curProtocol = window.location.protocol.split(':')[0];
if (curProtocol === 'https'){
bp.src = 'https://zz.bdstatic.com/linksubmit/push.js';
}
else{
bp.src = 'http://push.zhanzhang.baidu.com/push.js';
}
var s = document.getElementsByTagName("script")[0];
s.parentNode.insertBefore(bp, s);
})();
</script>
如果站長(zhǎng)使用PHP語(yǔ)言開發(fā)的網(wǎng)站,可以按以下步驟操作:
1、創(chuàng)建名為“baidu_js_push.php”的文件,文件內(nèi)容是上述自動(dòng)推送JS代碼;
2、在每個(gè)PHP模板頁(yè)文件中的 <body> 標(biāo)記后面添加一行代碼:
<?php include_once("baidu_js_push.php") ?>
為什么自動(dòng)推送可以更快的將頁(yè)面推送給百度搜索?
基于自動(dòng)推送的實(shí)現(xiàn)原理問(wèn)題,當(dāng)新頁(yè)面每次被瀏覽時(shí),頁(yè)面URL會(huì)自動(dòng)推送給百度,無(wú)需站長(zhǎng)匯總URL再進(jìn)行API推送操作。
借助用戶的瀏覽行為來(lái)觸發(fā)推送動(dòng)作,省去了站長(zhǎng)人工操作的時(shí)間。
自動(dòng)推送和API推送有什么區(qū)別?
已經(jīng)在使用普通收錄提交里的API推送(或sitemap)的網(wǎng)站還需要再部署自動(dòng)推送代碼嗎?
二者之間互不沖突,互為補(bǔ)充。已經(jīng)使用API推送的站點(diǎn),依然可以部署自動(dòng)推送的JS代碼,二者一起使用。
什么樣的網(wǎng)站更適合使用自動(dòng)推送?
自動(dòng)推送由于實(shí)現(xiàn)便捷和后續(xù)維護(hù)成本低的特點(diǎn),適合技術(shù)能力相對(duì)薄弱,無(wú)能力支持全天候?qū)崟r(shí)主動(dòng)推送程序的站長(zhǎng)。
站長(zhǎng)僅需一次部署自動(dòng)推送JS代碼的操作,就可以實(shí)現(xiàn)新頁(yè)面被瀏覽即推送的效果,低成本實(shí)現(xiàn)鏈接自動(dòng)提交。
同時(shí),我們也支持API推送和自動(dòng)推送代碼配合使用,二者互不影響。







