URL 如何優(yōu)化

2018-08-12 21:52 更新

URL 如何優(yōu)化

前言:本篇文章主要講解的內(nèi)容為“網(wǎng)址規(guī)范化優(yōu)化”,什么是網(wǎng)址規(guī)范化?做 SEO 的朋友們應(yīng)該都比較清楚,指的是搜索引擎挑選最合適的 URL 作為真正(規(guī)范化的)網(wǎng)址的過程。

那么,為什么要寫這么一篇文章呢?原因?yàn)椋汗P者平時(shí)在給客戶網(wǎng)站做 SEO 診斷的過程中,發(fā)現(xiàn)各種各樣的關(guān)于網(wǎng)址規(guī)范化的問題。由此可見,客戶對(duì)網(wǎng)址規(guī)范化這塊的知識(shí)點(diǎn)了解的非常少,甚至有的站長(zhǎng)都不知道這個(gè)是什么。所以,為了讓更多站長(zhǎng)學(xué)習(xí)到這塊的知識(shí)點(diǎn),筆者寫個(gè)網(wǎng)址規(guī)范化全面大解析。如果各位站長(zhǎng)覺得本篇文章對(duì)自身有幫助,還請(qǐng)不吝分享給其他站在學(xué)習(xí)!

一、首先,為什么會(huì)出現(xiàn)不規(guī)范網(wǎng)址?

如圖所示:

上面這幾個(gè) URL 指的是同一個(gè)文件:首頁

從技術(shù)上來說,這幾個(gè) URL 都是不同的網(wǎng)址,搜索引擎也確實(shí)把他當(dāng)作不同的網(wǎng)址,雖然這些網(wǎng)址返回的都是相同的文件,也就是首頁。但從技術(shù)上來說:主機(jī)完全可以對(duì)這幾個(gè)網(wǎng)址返回不同的內(nèi)容。那么,除了圖上帶與不帶 www 造成的,以及結(jié)尾是否帶有 index.html 后綴造成的不規(guī)范網(wǎng)址外,其實(shí)還有以下幾種原因會(huì)造成。例如: 1:網(wǎng)站程序的原因,不少 CMS 系統(tǒng)經(jīng)常出現(xiàn)一篇文章可以通過幾種不同的 URL 去訪問。 2:URL 靜態(tài)化設(shè)置存在錯(cuò)誤,同一篇文章中有多個(gè)靜態(tài)化 URL 可以訪問。如圖(截圖 URL 和訪問的標(biāo)題):

3:URL 靜態(tài)化后,靜態(tài)和動(dòng)態(tài) URL 共存,都有鏈接,也都可以訪問。 4:網(wǎng)站的目錄后帶與不帶斜杠。如圖:

下圖為不同的網(wǎng)址,但其實(shí)是一個(gè)頁面。

5:加密網(wǎng)址。如圖:

下圖的 URL 同時(shí)存在,但都可以訪問。

6:URL 中有端口號(hào)。如圖:

7:跟蹤代碼。有喜歡做網(wǎng)絡(luò)推廣的人,習(xí)慣在 URL 后面加跟蹤代碼。如圖:

二:其次,出現(xiàn)網(wǎng)址不規(guī)范會(huì)給網(wǎng)站帶來什么問題?

網(wǎng)站出現(xiàn)多個(gè)不規(guī)范網(wǎng)址會(huì)給搜索引擎收錄和排名帶來很多的麻煩,這個(gè)已經(jīng)是毋庸置疑的了。但是,還有不少站長(zhǎng)對(duì)這個(gè)網(wǎng)址不規(guī)范不是很重。例如筆者在給意向客戶看網(wǎng)站時(shí),發(fā)現(xiàn)不少網(wǎng)站的 URL 沒有做網(wǎng)址規(guī)范化。當(dāng)問他們?yōu)槭裁床蛔?URL 規(guī)范化?客戶回答:什么是網(wǎng)址規(guī)范化,怎么做,會(huì)寫在診斷建議方案上嗎?當(dāng)場(chǎng)就醉了......還有一部分的 SEO 診斷客戶,診斷的過程中發(fā)現(xiàn)網(wǎng)站的 URL 不規(guī)范問題很嚴(yán)重。這里,也希望這些部分站長(zhǎng)能夠在看完本篇文章后學(xué)習(xí)到規(guī)范化知識(shí)點(diǎn)。我們接著閱讀.....

為什么不規(guī)范的 URL 會(huì)給搜索引擎和排名帶來很多麻煩?為了讓站長(zhǎng)徹底的明白,我們舉個(gè)例子,比如:網(wǎng)站首頁是固定的且只有一個(gè),但很多站長(zhǎng)在鏈接回首頁的時(shí)候所使用的 URL 并不是唯一的,而是一會(huì)連到 http://www.admin5.cn,一會(huì)連到 http://www.admin5.cn/index.html。

一般來說,雖然不會(huì)給用戶造成什么麻煩,但因?yàn)檫@些網(wǎng)址都是同一個(gè)文件,會(huì)間接性的給搜索引擎造成困惑,搜索引擎會(huì)認(rèn)為:到底哪一個(gè)網(wǎng)址才是真正的首頁?哪一個(gè)網(wǎng)址應(yīng)該被當(dāng)作首頁返回?那么,這里有個(gè)重點(diǎn):如果網(wǎng)站上不同版本的網(wǎng)址同時(shí)出現(xiàn),就會(huì)很可能被搜索引擎收錄。被收錄之后,后果就可想而知了。而此時(shí),搜索引擎在計(jì)算排名的時(shí)候必須要找到所謂規(guī)范化的網(wǎng)址,也就是搜索引擎認(rèn)為的最合適的 URL 版本。

不規(guī)范化會(huì)造成的問題,筆者簡(jiǎn)單的來說下:

  • 1: 網(wǎng)站上有多個(gè) URL,這樣會(huì)分散頁面權(quán)重,不利于排名。
  • 2:搜索引擎判斷的規(guī)范化網(wǎng)址并不是站長(zhǎng)想要的那個(gè)網(wǎng)址。如圖(站長(zhǎng)想要的是不帶后綴的,搜索引擎去把帶后綴的給收錄了):

  • 3:如果網(wǎng)址規(guī)范化問題太嚴(yán)重,也可能影響收錄。因?yàn)椋阂粋€(gè)權(quán)重不是很高的域名,能收錄的總頁面數(shù)和蜘蛛總爬行時(shí)間是有限的,而搜索引擎把資源花在收錄不規(guī)范的網(wǎng)址上,留給獨(dú)特內(nèi)容的資源就變得越來越少了。
  • 4:重復(fù)頁面過多,搜索引擎可能認(rèn)為有作弊嫌疑。
  • 5:對(duì)于搜索引擎來說,浪費(fèi)資源、浪費(fèi)寬帶。

三、最后,如何解決網(wǎng)址規(guī)范化的問題

關(guān)于如何解決網(wǎng)址規(guī)范化問題,可能這個(gè)對(duì)于站長(zhǎng)而言是重點(diǎn)也是核心內(nèi)容了。那么,可以解決 URL 規(guī)范化問題的方法有很多,比如接下來我們要說的這些:

  • 1:現(xiàn)在企業(yè)、個(gè)人站長(zhǎng)用的程序最多的就是 CMS,那么此時(shí)你就要確定你使用的這個(gè) CMS 系統(tǒng)是否只能產(chǎn)生規(guī)范化網(wǎng)址,無論是否有靜態(tài)化,比如 DEDE、帝國(guó) CMS 等。
  • 2:所有內(nèi)鏈要保持統(tǒng)一,都指向規(guī)范化網(wǎng)址。比如:以帶與不帶 www 為例子,確定一個(gè)版本為規(guī)范化網(wǎng)址后,網(wǎng)站的內(nèi)部鏈接都要統(tǒng)一使用這個(gè)版本,這樣搜索引擎就會(huì)明白哪一個(gè)是站長(zhǎng)希望的網(wǎng)站規(guī)范化網(wǎng)址。而從用戶體驗(yàn)的角度去看:用戶通常第一選擇就是帶 www 的版本為規(guī)范化網(wǎng)址。
  • 3:301 轉(zhuǎn)向。這個(gè)最常用也是最普遍的一個(gè)方法,站長(zhǎng)可以通過 301 轉(zhuǎn)向把不規(guī)范化 URL 全部轉(zhuǎn)向到規(guī)范化 URL。
  • 4:canonical 標(biāo)簽。目前也是站長(zhǎng)使用比較多的一種了,而且百度也是全面支持這個(gè)標(biāo)簽了。 5:制作 XML 地圖,地圖中全部使用規(guī)范化網(wǎng)址,然后提交給搜索引擎。

雖然方法很多,但很多方法都有局限性,比如:有的網(wǎng)站因?yàn)榧夹g(shù)的缺失或不成熟,導(dǎo)致 301 無法實(shí)現(xiàn)。再比如:很多 CMS 系統(tǒng)經(jīng)常無法受自己控制等等。那么,筆者這里主要針對(duì) 301 和 canonical 做下具體的說明,因?yàn)檫@兩種規(guī)范化方式是站長(zhǎng)最常用的手段,而且也是百度最認(rèn)同的。我們繼續(xù)閱讀.....

網(wǎng)址規(guī)范化 之 301 轉(zhuǎn)向:

  • 1:什么是 301 轉(zhuǎn)向? 301 轉(zhuǎn)向又稱 301 重定向、301 跳轉(zhuǎn),是用戶或蜘蛛向網(wǎng)站服務(wù)器發(fā)出訪問請(qǐng)求時(shí),服務(wù)器返回的 HTTP 數(shù)據(jù)流中頭信息部分狀態(tài)碼的一種,表示本網(wǎng)址永久性轉(zhuǎn)移到另一個(gè)地址。

另外,還有其他的網(wǎng)址轉(zhuǎn)向方法,例如:302 轉(zhuǎn)向、javascript 轉(zhuǎn)向、PHP/ASP/CGI 程序轉(zhuǎn)向等。這里有個(gè)重點(diǎn):除了 301 轉(zhuǎn)向外,其他的方法都是常用的作弊手法,雖然方法本身沒有對(duì)錯(cuò)之分,但被作弊者用多了,搜索引擎對(duì)可疑的轉(zhuǎn)向都是非常敏感等。所以,其他的方法還是少用為妙。

  • 2:301 轉(zhuǎn)向傳遞權(quán)重

例如:網(wǎng)頁 A 用 301 重定向轉(zhuǎn)到網(wǎng)頁 B,搜索引擎可以肯定網(wǎng)頁 A 永久性改變地址,或者說實(shí)際上不存在了,搜索引擎就會(huì)把網(wǎng)頁 B 當(dāng)作唯一的有效目標(biāo)。而且,更重要的是:網(wǎng)頁 A 積累的頁面權(quán)重將被傳遞到網(wǎng)頁 B。

舉個(gè)例子:http://www.admin5.cn/是選定的規(guī)范化網(wǎng)址,下面的幾個(gè)網(wǎng)址都做 301 轉(zhuǎn)向到選定的規(guī)范化網(wǎng)址上,這樣搜索引擎就知道它是規(guī)范化網(wǎng)址,而且會(huì)把這三個(gè)網(wǎng)址的權(quán)重都傳遞集中到規(guī)范化網(wǎng)址上。

可能有站長(zhǎng)會(huì)問:301 轉(zhuǎn)向多久可以生效?一般來說的話,在百度站長(zhǎng)工具的改版工具上做下規(guī)則提交,大概一周左右就會(huì)生效。如圖:

  • 3:怎么樣做 301 轉(zhuǎn)向?

關(guān)于怎么做 301 轉(zhuǎn)向,這里建議參考這篇文章:(http://www.chinaz.com/web/2013/1212/330808.shtml)本篇文章,有詳細(xì)的 301 轉(zhuǎn)向操作方法,完全適合個(gè)人站長(zhǎng)和企業(yè)站長(zhǎng)。由于文字太長(zhǎng),這里就不寫了。

網(wǎng)址規(guī)范化 之 canonical 標(biāo)簽(參考下百度站長(zhǎng)平臺(tái)給出的標(biāo)準(zhǔn)):

  • 1:canonical 標(biāo)簽有什么作用?

對(duì)一組內(nèi)容完全相同或高度相似的網(wǎng)頁,通過使用 Canonical 標(biāo)簽可以告訴搜索引擎哪個(gè)頁面為規(guī)范的網(wǎng)頁,能夠規(guī)范網(wǎng)址并避免搜索結(jié)果中出現(xiàn)多個(gè)內(nèi)容相同或相似的頁面,幫助解決重復(fù)內(nèi)容的收錄問題,避免網(wǎng)站相同內(nèi)容網(wǎng)頁的重復(fù)展示及權(quán)重的分散,提升規(guī)范網(wǎng)頁的權(quán)重,優(yōu)化規(guī)范網(wǎng)頁的排名。

  • 2:如何用 canonical 標(biāo)簽指定規(guī)范網(wǎng)址?

可通過在每個(gè)非規(guī)范版本的 HTML 網(wǎng)頁的 部分中,添加一個(gè) rel="canonical" 鏈接來進(jìn)行指定規(guī)范網(wǎng)址。

例如,要指定指向網(wǎng)頁 http://www.admin5.cn/product.php?id=15786 的規(guī)范鏈接,需要按以下形式創(chuàng)建 元素:

然后將上述鏈接復(fù)制到某網(wǎng)頁所有非規(guī)范網(wǎng)頁版本的 部分中(例如 http://www.admin5.cn/product.php?id=15786&active=1),即可完成設(shè)置。

  • 3:可設(shè)置規(guī)范網(wǎng)頁的幾種情況舉例:

舉例一、社區(qū)帖子可能由于置頂、突出顏色等行為導(dǎo)致內(nèi)容完全相同的一個(gè)網(wǎng)頁產(chǎn)生不同的鏈接,搜索引擎只會(huì)選擇其中一個(gè)鏈接建立索引,如以下兩個(gè)鏈接不同,內(nèi)容完全相同的頁面: http://www.a5.net/forum.php?mod=viewthread&tid=17868770&page=1#pid115642474 http://www.a5.net/thread-17868770-1-1.html

舉例二、對(duì)商品的列表頁面,按照價(jià)格或者優(yōu)惠等順序進(jìn)行排序,但網(wǎng)頁內(nèi)容高度相似: http://mall.leho.com/pr-list?locid=75fb2a357d38397c5e1e75fa&cid=5e1e02f950a4101fb27571ee&order=discount http://mall.leho.com/pr-list?order=price_asc&locid=75fb2a357d38397c5e1e75fa&cid=5e1e02f950a4101fb27571ee

舉例三、網(wǎng)站有多個(gè)網(wǎng)頁展示的為相同型號(hào)的商品,只是每個(gè)網(wǎng)頁商品圖的顏色不同,其他內(nèi)容幾乎完全相似,此時(shí)也可設(shè)置 rel="canonical",將當(dāng)下最流行色彩的商品網(wǎng)頁設(shè)置規(guī)范網(wǎng)頁,推薦百度有優(yōu)先將其顯示在搜索結(jié)果中。

  • 4:百度會(huì)完全遵守 rel="canonical"標(biāo)簽嗎? 網(wǎng)頁中添加該標(biāo)簽后,就代表站長(zhǎng)向百度推薦某個(gè)網(wǎng)頁作為最規(guī)范的網(wǎng)頁版本,百度會(huì)同時(shí)根據(jù)標(biāo)簽的推薦及系統(tǒng)算法選擇出最合適的網(wǎng)頁將其顯示在搜索結(jié)果中。百度會(huì)根據(jù)網(wǎng)頁內(nèi)容實(shí)際情況考慮 Canonical 標(biāo)簽中推薦的網(wǎng)頁,但不保證完全遵守該標(biāo)簽。為了保證標(biāo)簽的效果,請(qǐng)保證一個(gè)頁面中僅有一個(gè) Canonical 標(biāo)簽。

  • 5:此鏈接是相對(duì)的還是絕對(duì)的? rel="canonical" 可與相對(duì)鏈接或絕對(duì)鏈接一起使用,但建議您使用絕對(duì)鏈接,以最大程度地減少可能出現(xiàn)的混亂或問題。

  • 6:rel="canonical"標(biāo)簽可用于在不同的域名中建議規(guī)范網(wǎng)址嗎? 如果網(wǎng)站需要更換域名,且使用的服務(wù)器不能創(chuàng)建服務(wù)器端重定向網(wǎng)址的情況下,就可以使用 rel="canonical" 鏈接元素指定希望百度收錄域的網(wǎng)址。

寫在最后:

關(guān)于網(wǎng)址規(guī)范化,本篇文章給出了最詳細(xì)的文字說明,希望個(gè)人和企業(yè)等站長(zhǎng)在看完本篇文章后,能夠更多的掌握住網(wǎng)址規(guī)范化的知識(shí)點(diǎn)和操作方法。當(dāng)然,如果您覺得本文幫助到您了,請(qǐng)不吝分享一下,將它傳播出去。

以上內(nèi)容是否對(duì)您有幫助:
在線筆記
App下載
App下載

掃描二維碼

下載編程獅App

公眾號(hào)
微信公眾號(hào)

編程獅公眾號(hào)