網(wǎng)站無論大小,單獨的網(wǎng)站地圖頁面都是必需的。通過網(wǎng)站地圖,不僅用戶可以對網(wǎng)站的結(jié)構(gòu)和所有內(nèi)容一目了然,搜索引擎也可以跟蹤鏈接爬行到網(wǎng)站所有主要部分
HTML網(wǎng)站地圖
網(wǎng)站地圖有兩種形式。.第一種稱為HTML版本的網(wǎng)站地圖,英文是 sitemap,s需小寫,特指HTML版網(wǎng)站地圖。HTML版本網(wǎng)站地圖就是用戶可以在網(wǎng)站上看到的、列出網(wǎng)站上所有主要頁面鏈接的頁面。
對一些主導航必須使用JS腳本 或 Flash的網(wǎng)站(雖然我想不到什么原因必須要這么做),網(wǎng)站地圖是搜索引擎找到網(wǎng)站所有頁面的重要補充途徑。
對小網(wǎng)站來說,網(wǎng)站地圖頁面甚至可以列出整個網(wǎng)站的所有頁面。
但對稍具規(guī)模的網(wǎng)站來說,一個網(wǎng)站地圖面不可能羅列所有頁面鏈接,可以采取兩種辦法。一種方法是網(wǎng)站地圖只列出網(wǎng)站最主要部分鏈接,如一級分類、二級分類。另一種方法是將網(wǎng)站地圖分成多個文件,主網(wǎng)站地圖列出通往次級網(wǎng)站地圖的鏈接,次級網(wǎng)站地圖再列出一部分頁面鏈接。多個網(wǎng)站地圖頁面加在一起,可以列出所有或絕大部分重要頁面。
實際上一個具有良好導航系統(tǒng)和鏈接結(jié)構(gòu)的網(wǎng)站,并不一定需要完整的、列出所有頁面的網(wǎng)站地圖,因為網(wǎng)站地圖與分類結(jié)構(gòu)經(jīng)常是大同小異的。
XML網(wǎng)站地圖
網(wǎng) 站地圖的第二種形式是XML版本的網(wǎng)站地圖。英文Sitemap中的S大寫時通常特指XML版本的網(wǎng)站地圖。
XML網(wǎng)站地圖由 Google于 2005年首先提出,2006年微軟、雅虎都宣布支持。2007年各主要搜索引擎都開始支持通過 robots文件指定XML網(wǎng)站地圖位置。百度也支持XML版本網(wǎng)站地圖。
XML版本網(wǎng)站地圖由XML標簽組成,文件本身必須是ut8編碼。網(wǎng)站地圖文件實際上就是列出網(wǎng)站需要被收錄的頁面URL。最簡單的網(wǎng)站地圖可以是一個純文本文件,文件只要列出頁面URL,一行列一個URL,搜索引擎就能抓取并理解文件內(nèi)容。
標準版本的XML網(wǎng)站地圖文件如下列代碼所示:
<?xml version="1.0" encoding="UTF-8"?>
?。紆rl> <loc>http: //www.example.com/</loc> ?。糽astmod>2010-01-01</lastmod> <changefreq>monthly</changefreq> ?。紁riority>0.8</priority> ?。?url> ?。?urlset> 其中 urlset t標簽是必需的,聲明文(件所使用的) Sitemap 協(xié)議版本。 url標簽也是必需的,是它下面所有網(wǎng)址的母標簽。 loc標簽也是必需的,這一行列出的就是頁面完整URL。 lastmod是可選標簽,表示頁面最后一次更新時間。. changefreq是可選標簽,代表文件更新頻率。標簽值包括: always,一-直變動,指的是每次訪問頁面內(nèi)容都不同.。 hourly,每小時。 daily,每天。 weekly,每星期。 monthly,每月。 yearly,每年。 never,從不改變。 網(wǎng)站地圖中聲明的更新頻率對搜索引擎來說只是一個提示,供搜索引擎蜘蛛?yún)⒖?,但搜索引擎不一定真的認為頁面更新頻率就是站長自己聲明的那樣。 priority是可選標簽,表示URL的相對重要程度??蛇x0.0到1.0之間的數(shù)值,1.0為最重要,0.0為最不重要。默認重要程度值為0.5。站長可以使用 priority 標簽告訴搜索引擎這個URL的優(yōu)先級,比如通常首頁肯定是1.0,分類頁面可能是0.8,其他更深層頁面重要性依次下降。這里所標志的重要程度只是相對于這個網(wǎng)站內(nèi)部的URL所說的,與其他網(wǎng)站的URL重要性無關。所以把頁面重要性標為1.0,并不能讓搜索引擎認為這個頁面比其他網(wǎng)站的頁面更重要,只是告訴搜索引擎這個頁面在本網(wǎng)站內(nèi)是最重要的。 XML網(wǎng)站地圖文件最多可以列出5萬個URL,文件不能超過10MB。如果網(wǎng)站需要收錄的URL超過5萬個,可以使用網(wǎng)站地圖索引文件,也就是分成多個網(wǎng)站地圖文件。一個網(wǎng)站最多可以有1000個XML網(wǎng)站地圖文件,也就是可以列出5000萬個網(wǎng)址。 制作好網(wǎng)站地圖文件后,可以有兩種方式通知搜索引擎網(wǎng)站地圖的位置,一是在站長工具后臺提交網(wǎng)站地圖文件。目前百度、 360、Google、必應的站長工具都有這個功能。另外一種方式是在 robots.. txt文件中通知搜索引擎網(wǎng)站地圖文件位置,代碼如 下所示: sitemap:http: //www.example. com/sitemap.xml 所有主流搜索引擎都支持 robots文件指定網(wǎng)站地圖文件位置。
通過XML網(wǎng)站地圖通知搜索引擎要收錄的頁面,只能讓搜索引擎知道這些頁面的存在,并不能保證一定被收錄,搜索引擎還要看這些頁面的權(quán)重是否達到收錄的最低標準。所以XML網(wǎng)站地圖只是輔助方法,不能代替良好的網(wǎng)站結(jié)構(gòu)。
大中型網(wǎng)站提交網(wǎng)站地圖通常有比較好的效果,能使收錄增長不少。但也有的網(wǎng)站,尤其是小型網(wǎng)站,提交網(wǎng)站地圖沒有什么效果,有的站長甚至認為有反效果。