技術SEO(Technical SEO)一直是SEO中最重要的部分。頁面需要具有可爬網性和可索引性,才能獲得排名,但是與內容和鏈接相比,許多其他活動的影響將最小。我們編寫了該初學者指南,以幫助您了解一些基本知識,以及在哪些時間最好花時間來最大程度地發揮影響力。整篇文章都鏈接了許多其他資源,最后還有更多資源供您了解更多。
第1章:技術SEO基礎
由于這是新手指南,因此我們從基礎開始。
什么是技術SEO?
技術SEO是優化網站以幫助搜索引擎(例如Google)查找,抓取,理解和索引頁面的過程。我們的目標是找到并提高排名。
技術SEO有多復雜?
這取決于?;局R并不是很難掌握,但是技術SEO可能很復雜且難以理解。通過本指南,我將使事情變得盡可能簡單。
第2章:了解爬網
在本章中,我們將介紹如何確保搜索引擎可以有效地抓取您的內容。
搜尋的運作方式
抓取工具從頁面中獲取內容,并使用這些頁面上的鏈接查找更多頁面。這樣一來,他們就可以在網絡上查找內容。在此過程中,我們將討論一些系統。
網址來源
爬蟲必須從某個地方開始。通常,他們會創建一個通過頁面鏈接找到的所有URL的列表。查找更多URL的輔助系統是由用戶或具有頁面列表的各種系統創建的站點地圖。
抓取隊列
將對所有需要爬網或重新爬網的URL進行優先級排序,并將其添加到爬網隊列中。這基本上是Google想要抓取的URL的有序列表。
履帶式
抓取頁面內容的系統。
處理系統
這些系統處理各種規范,我們將在稍后討論,將頁面發送到渲染器,渲染器將加載頁面,就像瀏覽器一樣,并處理頁面以獲取更多要爬網的URL。
渲染器
渲染器會像瀏覽器一樣加載一個頁面,其中包含JavaScript和CSS文件。這樣做是為了讓Google可以看到大多數用戶會看到的內容。
指數
這些是Google顯示給用戶的存儲頁面。
抓取控件
您可以通過幾種方法來控制在您的網站上進行爬網的內容。這里有一些選擇。
Robots.txt
robots.txt文件會告訴搜索引擎在您的網站上可以訪問和不能訪問的位置。
只是一個簡短的說明。如果鏈接指向無法訪問的頁面,則Google可能會為其編制索引。這可能會造成混淆,但是如果您希望避免對頁面進行索引,請查看此指南和流程圖,以指導您完成整個過程。
抓取率
您可以在robots.txt中使用一個抓取延遲指令,許多抓取工具都支持該指令,該指令可讓您設置抓取頁面的頻率。不幸的是,Google不尊重這一點。對于Google,您需要按照此處所述在Google Search Console中更改抓取速度。
存取限制
如果您希望某些用戶可以訪問該頁面,但搜索引擎不能訪問該頁面,那么您可能想要的是以下三個選項之一:
某種登錄系統
HTTP身份驗證(需要密碼才能訪問)
IP白名單(僅允許特定的IP地址訪問頁面)
這種類型的設置最適合內部網絡,僅會員內容或暫存,測試或開發站點之類的事情。它允許一組用戶訪問頁面,但是搜索引擎將無法訪問他們,也不會為頁面建立索引。
如何查看抓取活動?
具體來說,對于Google而言,查看其抓取內容的最簡單方法是使用Google Search Console抓取統計信息報告,該報告為您提供了有關他們如何抓取您的網站的更多信息。如果要查看網站上的所有爬網活動,則需要訪問服務器日志,并可能使用一種工具來更好地分析數據。這可以相當先進,但是如果托管服務器具有控制面板(如cPanel),則應該可以訪問原始日志和一些聚合器(如Awstats和Webalizer)。
每個網站將具有不同的抓取預算,這是Google希望抓取一個網站的頻率和您的網站允許抓取的數量的總和。較熱門的頁面和經常更改的頁面將被更頻繁地爬網,而似乎不受歡迎或鏈接不緊密的頁面將被較不頻繁地爬網。如果抓取工具在抓取您的網站時發現壓力大的跡象,通常會放慢速度甚至停止抓取,直到情況改善為止。抓取頁面后,頁面將被呈現并發送到索引。索引是可為搜索查詢返回的頁面的主列表。讓我們來談談索引。
第3章:了解索引
在本章中,我們將討論如何確保您的頁面被索引并檢查它們如何被索引。
機器人指令
漫游器元標記是一個HTML代碼段,它告訴搜索引擎如何對特定頁面進行爬網或編制索引。它放置在網頁的<head>部分中,如下所示:
<meta name=“robots”content=“noindex”/>
規范化
當同一頁面有多個版本時,Google會選擇一個版本存儲在其索引中。此過程稱為規范化,選擇為規范的URL將是Google在搜索結果中顯示的URL。他們使用多種不同的信號來選擇規范的URL,包括:
規范標簽
頁面重復
內部連結
重新導向
站點地圖網址
查看Google如何為頁面建立索引的最簡單方法是使用Google Search Console中的URL Inspection Tool。它將顯示Google選擇的規范URL。
第4章:技術SEO速勝方法
對于SEO來說,最困難的事情之一就是確定優先級。有很多最佳做法,但是某些更改會比其他更改對您的排名和點擊量產生更大的影響。這是我建議優先考慮的一些項目。
檢查索引
確保您希望人們找到的頁面可以在Google中建立索引。前兩章都是關于爬網和索引的,這絕不是偶然的。您可以在“網站審核”中查看“可索引性”報告,以查找無法建立索引的頁面及其原因。
找回丟失的鏈接
多年來,網站傾向于更改其URL。在許多情況下,這些舊的URL具有來自其他網站的鏈接。如果未將其重定向到當前頁面,則這些鏈接將丟失,并且不再計入您的頁面。進行這些重定向還為時不晚,您可以迅速收回任何丟失的價值。將此視為您將做的最快的鏈接構建。站點瀏覽器->yourdomain.com->頁面->最佳鏈接->添加“404未找到”HTTP響應過濾器。
我通常按“引用域”進行排序。查看archive.org中的第一個URL,我發現這以前是母親節頁面。通過將該頁面重定向到當前版本,您可以收回來自59個不同網站的225個鏈接,并且還有更多的機會。您需要301將所有舊的URL重定向到它們的當前位置,以收回丟失的價值。
添加內部鏈接
內部鏈接是從您網站上的一頁到您網站上另一頁的鏈接。它們有助于找到您的頁面,也有助于提高頁面排名。在站點審核中,我們有一個稱為“鏈接機會”的工具,可幫助您快速找到這些機會。
添加架構標記
架構標記是可以幫助搜索引擎更好地理解您的內容并提供許多功能的代碼,這些功能可以幫助您的網站在搜索結果中脫穎而出。Google有一個搜索庫,其中顯示了各種搜索功能以及使您的網站符合資格所需的架構。
第5章:其他技術SEO內容
我們將在本章中討論的項目都是需要重點關注的好東西,但與上一章中的速贏項目相比,它們可能需要更多的工作,并且收益較少。這并不意味著您不應該這樣做,僅是為了幫助您了解如何確定各個項目的優先級。
頁面體驗信號
這些是排名因素較少的因素,但仍然是您要為用戶著想的東西。它們涵蓋了影響用戶體驗(UX)的網站內容。
核心網絡生命
核心網絡生命周期是速度指標,它是Google的“頁面體驗”信號的一部分,用于衡量用戶體驗。這些度量標準使用最大內容繪畫(LCP)來衡量視覺負載,使用累積布局偏移(CLS)來衡量視覺穩定性,并使用“第一輸入延遲”(FID)來衡量交互性。
HTTPS
HTTPS保護瀏覽器和服務器之間的通信不受攻擊者的攔截和篡改。這為當今的絕大多數WWW流量提供了機密性,完整性和身份驗證。您要通過HTTPS而不是HTTP加載頁面。任何在地址欄中顯示鎖定圖標的網站都在使用HTTPS。
移動端界面友好
簡而言之,這將檢查網頁是否顯示正確以及是否容易被移動設備上的人們使用。您如何知道您的網站對移動設備的友好程度?在Google Search Console中查看“移動設備可用性”報告。該報告可以告訴您您的網頁是否存在移動設備友好性問題。
安全瀏覽
這些檢查是為了確保網頁不具有欺騙性,不包含惡意軟件以及沒有任何有害下載。
插頁式廣告
插頁式廣告會阻止內容顯示。這些彈出窗口涵蓋了用戶離開之前可能必須與之交互的主要內容。
Hreflang-多種語言
Hreflang是HTML屬性,用于指定網頁的語言和地理區域。如果您在同一頁面上使用不同的語言有多個版本,則可以使用hreflang標記來告知搜索引擎(如Google)這些變化。這有助于他們為用戶提供正確的版本。
常規維護/網站運行狀況
這些任務不太可能對您的排名產生太大影響,但通常是可以改善用戶體驗的好東西。
鏈接斷開
斷開的鏈接是您網站上指向不存在的資源的鏈接-這些鏈接可以是內部的(即,指向您域中的其他頁面),也可以是外部的(即,指向其他域中的頁面)。
重定向鏈
重定向鏈是在初始URL和目標URL之間發生的一系列重定向。
第6章:SEO技術工具
這些工具可幫助您改善網站的技術方面。
Google Search Console
Google Search Console(以前稱為Google網站管理員工具)是Google的一項免費服務,可幫助您監視網站并在其搜索結果中對其進行故障排除。使用它來查找和修復技術錯誤,提交站點地圖,查看結構化數據問題等。Bing和Yandex都有自己的版本,Google的“移動設備友好測試”檢查訪問者在移動設備上使用您的頁面的方便程度。它還可以識別特定的移動可用性問題,例如太小而無法閱讀的文本,使用不兼容的插件等等。
Chrome DevTools
Chrome DevTools是Chrome的內置網頁調試工具。使用它來調試頁面速度問題,提高網頁呈現性能等。從技術SEO的角度來看,它具有無限的用途。