一開始原本打算講搜尋引擎的分類,不過後來覺得與其講古不如直接切入主題更合適一點。於是我就從搜尋引擎如何工作的開始做個簡單的說明。
請各位看一下下圖,這張圖取自於 inforbrother.com 的搜尋引擎介紹圖,很清楚地解釋了一個搜尋引擎(特別是 Google)如何工作完成用戶搜尋的需求。
我說明一下工作流程:
- 搜尋引擎會派出自己的蜘蛛(也有人稱為爬蟲)。不同的搜尋引擎有不同的蜘蛛,比如說:Google 有的蜘蛛以文字搜尋為主,有的以圖片為主,這些蜘蛛會查找網站上值得查找的內容,然後帶回告訴搜索引擎這次發現的網頁是什麼樣的網頁。
- 蜘蛛找到這些網頁之後,會把網頁上的所有連結以及關鍵字帶回去,然後讓搜尋引擎將這些找到的網頁編入索引當中。
- 當一個訪客在搜尋引擎上輸入要搜尋的關鍵字之後,搜尋引擎就動起來了,它會先根據訪客輸入的關鍵字進行排查,是否有相關的關鍵字網頁已經被收錄在索引資料庫當中。
- 搜尋引擎根據關鍵字進行比對,比對目前已經收錄在索引資料庫當中的資料是否存在。
- 當搜尋引擎發現資料庫當中保存有大量的內容,它就會開始進行排序顯示。搜尋引擎會使用它自身的演算法來判定每一個網頁在這個找到的資料庫頁面中排序的規則。
- 當排序確認之後,搜尋引擎會將排序結果按照演算法的規則展現相關的結果並且加上對應的URL,形成一張張的搜尋結果頁面。同時搜尋引擎會將搜尋總次數以及對應的廣告內容顯示在結果頁上面。
看起來挺簡單的,但背後隱藏的卻是非常精密的運算邏輯。首先,蜘蛛並不是一次抓完所有的網頁,然後才會到搜尋引擎的,它還會按查找的模式區分淺層的查找以及深層的查找,也就是有些蜘蛛求數量越多越好,有些蜘蛛則是針對一個網域進行深層網頁的查找。
其次,當訪客開始使用關鍵字查找對應內容的時候,輸入的內容會隨著訪客輸入的內容而不斷變化,逐步逼近一般用戶經常會查找的內容進行更精細的比對,如下圖:
當我們提交關鍵字之後,搜尋引擎會從大量的資料庫當中找到匹配的結果,並根據相關性在不到一秒鐘的時間內對它們進行算法排名。這裡展示出來的結果會告訴你這個搜尋引擎的廣泛度與速度,當然也跟搜尋的速度有非常大的關係。如果速度過慢,訪客可能在還沒顯示結果就離開了。
搜尋引擎根據關鍵字搜尋結果展開排序。搜尋引擎並不會公布排序的規則,但它會依照相關性、用戶搜尋這個字詞的意圖、4C (style、format、type、angle)結果還有新鮮度、內容品質(Expertise、Authority、Trust)給出答案。以下方的例子來說,搜尋引擎會告訴你跟 iphone 12 max 相關的各項結果。
此外,搜尋引擎會根據我們輸入的關鍵字詞,找到對應的同義詞。例如:「股票」這個詞,就會關聯到「財經」、「報價」等相關關鍵詞(但它不會告訴你這只股票的明牌,哈哈)。
不同的搜索引擎在結果頁顯示的內容不同,這些內容的展現結果其實都跟搜尋引擎本身的演算法相關。以 Google 為例,下方是我提供的內容,提供給各位參考:
而當我們選擇百度搜尋的時候,結果則是下方這樣的圖:
簡單的比較來說,Google 認為搜尋的過程,更重要的不全然是答案本身,它更重視的是隨著搜尋結果帶來的知識圖譜,而且 Google 的內容重視的是即時性以及權威性;而百度的部分則是以關鍵字為主要結果,並不那麼考慮知識圖譜的方向,反而像是一個入口網站的概念,它的搜尋結果主要是自身的服務,例如百度百科、百度貼吧等這一類的內容。
而在 Bing 必應來說,它自己的搜尋展現結果又不一樣。這個排序結果沒有好壞,而是產品經理選擇的問題。以百度來說,它雖然被大陸民眾普遍吐槽,但除了它之外,其他的搜尋引擎並沒有真的獲得成功;特別是百度在2016年的
魏則西事件,更是讓中國用戶對百度的不信任達到高峰,還導致中國政府介入,要求百度別為了錢而失去了搜尋的底線。也因此雖然百度在中國的市場佔有率雖然很高,但在全世界的搜尋總量來說其實很低,從專業的 Statcounter 報告當中,百度只有 1%左右。以下是中國各家搜尋引擎的比較結果(Baidu 百度 | Sogou 搜狗 | Shenma 神馬 | Haosou 360 搜索 | 其他):
中國搜尋引擎市佔率 來源:Statcounter | November/2020
全世界的主要搜尋引擎市佔率 來源:Statcounter | November/2020
從上圖觀察搜尋引擎的總量來看,我們就可以發現 Google 的市佔率高達92%,而百度則只占了1.14%。當然這個結果並不代表 Google 的最好,只能說你所在的地區支援那些搜尋引擎,你只要在這個當中找到最合適的搜尋引擎。這一期就先講到這裡,下一期就要進入 SEO 的細節操作了。