
Swipe to Unlock: The Primer on Technology and Business Strategy
- 作者: 尼爾・梅達、帕爾・德托賈、阿迪亞・加傑
- 原文作者: Neel Mehta, Parth Detroja, Aditya Agashe
- 譯者: 劉榮樺
- 出版社:商業周刊
- 出版日期:2020/02/13
#1 Google搜尋
Google搜尋功能是如何運作?
搜尋時92%的時間你會點選在第一頁也就是前十筆的搜尋結果。從三十兆個網頁中找到這十筆是非常困難的,實際上Google並非在每次搜尋時才前往網路上的每個頁面。Google是事先將網頁的資訊存在資料庫(資訊的表格,如Excel),然後使用演算法(一連串的指令)讀取資料庫,並決定要呈現哪些內容。
爬取 Crawl → 建立索引資料庫
Step1 使用稱為蜘蛛的程式來爬取網頁,直到找到所有頁面(或者Google覺得是所有的頁面)。
Step2 蜘蛛將找到的頁面新增到Google的網頁列表,稱為索引index。
Step3 蜘蛛從這些頁面向外的連結開始,找到新的一組頁面,也加到索引中。
Step4 在新的頁面上的連結重複同樣的步驟,直到無法再找到其他頁面。
爬取的動作不斷在進行,Google一直在新增頁面到索引。或者當頁面有變更時,Google也會更新索引。故索引的檔案規模非常巨大,超過一億萬GB。
關鍵字密度
當你在Google進行搜尋時,Google會抓取查詢內容(你輸入在搜尋框的文字),然後比對他的索引,尋找最相關的頁面。
Google如何做到這件事?最簡單的方法就是尋找特定關鍵字出現的地方,有點類似按下Ctrl+F搜尋一個巨大的Word文件。這是90年代搜尋引擎運作的方式:在索引中尋找符合你搜尋的文字,並且顯示最相關的頁面,這個「相關」的屬性稱為關鍵字密度。
這個方法很好操弄,假如你輸入士力架糖果棒,預想官方網站會排在第一位。但如果搜尋引擎只是計算士力架這個單字出現在頁面上的次數,任何一個人製作的頁面只要出現士力架士力架士力架士力架士力架士力架,就會被排到搜尋結果首位。顯然不是非常好的方式。
佩吉排序 PageRank
捨棄關鍵字密度,Google核心技術是一個稱為佩吉排序的演算法。當你在Google進行搜尋時,Google會用多個準則進行排序,包含佩吉排序。
佩吉排序是由Google創辦人賴瑞·佩吉 Larry Page 與謝爾蓋·布林 Sergey Brin 在1998年為了博士論文所撰寫的。他們注意到,一個網頁的重要性可以從哪些重要的網頁連結到該網頁來進行評估。這就如同在一個派對,你知道某人受歡迎,是因為他被其他受歡迎的人包圍。佩吉排序給每個網頁一個分數,這個分數是由其他連至該頁面的其他網頁的佩吉分數所計算出來的,計算方式是線性代數。佩吉排序關心的是品質而不是數量。即使好幾十個沒沒無名的部落格連結到網頁,佩吉分數也不會提高太多。但假如是紐約時報或是任何一篇分數很高到文章連結到我們的頁面,分數就會大爆發。
Google也有其他的演算準則,例如頁面更新的時間,忽略看似垃圾的頁面(如士力架士力架士力架士力架士力架士力架);Google也會考慮你所在的位置,例如你在美國搜尋足球會回傳美式足球聯盟,你在英國搜尋足球會回傳英格蘭足球超級聯賽。
佩吉排序仍然會被操弄,例如連結農場link farm,藉由收費將各種不相關的網址貼進連結農場,藉由人為操作使佩吉排序暴增。
SEO產業
搜尋引擎最佳化 search engine optimization 的產業興起,幫助網站擁有者破解Google搜尋演算法。最基本的方法是讓更多網頁連結到你的頁面,選擇對的頁面名稱及關鍵字,讓你的網頁匹此相連等等,以提高網頁在Google的排序。然而Google的搜尋演算法一直在變:Google在一年有超過五百次的小升級,爾偶會有一些大升級。
#2 網際網路
資訊的基礎
電腦是用1跟0來儲存所有資訊。當你的電腦想要傳遞資訊給另一台電腦(使用TCP、IP、HTTP/HTTPS),他需要在纜線上移動0跟1。電腦將0跟1轉變的光細微閃動,1代表光持續亮著不到1秒,0則代表在同樣的時間長度中光暗了。
- 資訊是藉由很長的地底纜線移動的。
普遍的纜線類型是光纖纜線,是由純玻璃所製作,並且不會厚於人類的一根頭髮。這些閃動藉由光纖,用2/3的光速傳輸。 - 位元、KB、MB、GB
每一個0和1=位元bit、每八個位元=位元組byte、1000個byte=KB, kilobyte、100萬個byte=MB, megabyte、10億個byte=GB、1兆個byte=TB, terabytes。
位元太小了,所以都用位元組來測量資料的大小。假設我們使用的數字是166,在二進位制就是10100110。
Netflix和Excel也許相當不同,但都是從同樣的結構單元所發出來的。
事實上,每個應用程式都是從相同的結構單元開發的。
網際網路如何連接上網站
當你輸入google.com按下enter會發生什麼事?
輸入google.com按下enter(請求request)
→ 瀏覽器補齊URL
→ 電腦利用DNS尋找google.com的IP位址
→ 瀏覽器(前端frontend)打包這些請求、傳送到伺服器server(後端backend)
→ 伺服器運算網頁的樣貌
→ 伺服器將程式碼傳回瀏覽器(回應response)
→ 瀏覽器呈現網頁
資訊如何在網際網路傳遞?
網際網路的傳送過程很像包裹郵件。
Step1 封包packets
網頁通常很大,無法一次就傳輸完畢,TCP將其拆成很多小型的封包,並在其上貼標籤例如1/10。
Step2 伺服器利用DNS尋找你的IP位址
Step3 IP是將每個封包利用短程傳輸的方式,或是稱為中繼段hops,在全世界傳送。每個封包可能會經過不同的中繼點,抵達時間也不同。
Step4 當封包抵達你的電腦,TCP會將他們依照正確的順序組合起來,並確認是否有遺失。如果有遺失,他會要求網站將遺失的封包再傳送一次。
位址解碼
- 網域名稱
網際網路的地址,讓不同人很容易的找到相同頁面,這個網址稱作URL, Uniform Resource Locator 一致性資源定位器。google.com是真正的URL http://www.google.com的縮寫,不過瀏覽器知道這個縮寫代表什麼,所以會自動將其他內容補上。當瀏覽器看到完整的URL時,將URL拆解,才能真正知道要到哪個頁面去。如同你將地址拆解成門牌號碼、街道、城市等等。 - 通訊協定
瀏覽器該如何連接到網站。如同你要搭Uber去某個地方,可以選擇不同的車型。
通訊協定有兩種:
(1) 通常預設的是HTTP, Hyper Text Transfer Protocol 超文字傳輸協定,在URL的顯示方式為http://。
(2) 更為安全與加密的HTTP版本是HTTPS, Hyper Text Transfer Protocol Secure 安全超文字傳輸協定,代表瀏覽器應該要加密使用者的資訊,避免被駭客入侵。 - 全球資訊網 world wide web, www
此部分對大部分的網站來說不是必要的,但是瀏覽器為了網址的完整性,都會顯示出來,就如同台灣人給台灣人電話,不需要加+886。 - 網域名稱
如google.com,每個網站都有自己的網域名稱。 - 網域名稱後面的部分稱為路徑 path
例如http://www.google.com/map。沒有指定路徑的話,瀏覽器會使用斜線/作為佔位路徑的預設值,例如http://www.google.com/。 - IP位址
IP, Internet Protocol 網際網路協定
給電腦看的網址,因為電腦只能辨別數字。 - 網域名稱服務 Domain Name Service, DNS
為了轉換網域名稱到IP位址,電腦利用DNS這個服務,如同巨大的通訊錄。
電腦會保存最近使用過的網域名稱與IP位址對應資料在硬碟裡。假如電腦找不到對應網域名稱的IP位址,會向網際網路服務商 internet service provider, ISP 詢問。 - TCP, Transmission Control Portocol 傳輸控制協定
#3 動態消息演算法
Facebook如何決定哪些內容會出現在你的動態消息中
出現在動態消息上的內容有強大影響力,臉書要如何將使用者所收到數以百計甚至數以千計的更新內容排序?臉書有數十萬個個人化要素,我們將會聚焦在四個關鍵要素上:
動態消息能見度=C發文者XP發文品質XT類型XR近期
C對於發文者有興趣的程度:與你互動較頻繁的發文者=你想看
P這篇發文在其他使用者中表現如何:越多人按讚或留言=有趣
T使用者偏好哪一類發文(動態、照片、連結)
R發文時間有多近
其他:連線速度較慢的使用者較少看到影片。留言當中有恭喜字樣代表人生大事發生,較容易被推廣。點擊文章後按讚,比沒點擊文章就按讚,能獲得更多的正面評分。
這些度量衡 metric 稱為互動 engagement。
臉書試圖提高你停留在動態消息的可能,因為你越往下滑停留越久,你將會看到越多廣告,而這是臉書的收入來源。
#4 廣告
Facebook如何賺進十幾億但不需向使用者收費?廣告是Google與Facebook的獲利方法,廣告收入佔了Facebook的99%。他們賺到非常多錢的原因,是因為「定向targeting」技術。沒有別的公司做得比這兩家好,兩巨頭幾乎掌控了廣告業,合佔了行動廣告市場的一半。
定向廣告技術
你不需付費給Facebook,而是給出你的個人資訊。你的每一個點擊,以及大量關於你的興趣、習慣與活動。蒐集使用者在Google和Facebook活動的相關資訊,假定為使用者喜好,推送給使用者合適的廣告,能有效改善點閱率 click-thriugh rate, CTR,並向廣告商收取更高的費用。
當你不付費給一個產品,你就是產品。
原生廣告
贊助內容sponsored,也稱原生廣告native advertising,將廣告和正常的內容混在一起,使用者會比較認真看廣告。原生廣告被點擊的次數是一般橫幅廣告的兩倍。例如IG常會看到,甚至推特讓廣告商購買主題標籤來開始引導「趨勢tremding」。
- 現在應用程式較少設計橫幅廣告,因為很擾人、點擊率低(約0.17%=每六百次廣告才有一次點擊),且會佔據寶貴空間。
贊助廣告在新聞業發展特別快速,廣告商可以付費將看起來正常的文章(其實就是廣告)放在新聞網站,有越來越多的新聞變成包裝過的廣告。例如「為什麼傳統的監獄制度對女性犯人沒有作用?」這是一篇做過良好調查、具吸引力的故事,但其實是Netflix影集《勁爆女子監獄》的廣告。網際網路摧毀新聞業的傳統商業模式後,原生廣告是少數幾個讓報業獲利的方式。
廣告拍賣
當廣告商想在Google與Facebook上放置廣告,廣告商出價他們願意付多少錢給觀看和點擊=競標金bid。當每次有訪客進去頁面時,所有廣告商都會進入立即的競標auction,贏家的廣告就會顯示出來。
出價高的未必就會贏,因為還有其他標準例如廣告相關性,因為相關性越高的廣告可能獲得越高的點擊,對Google與Facebook來說更能賺錢。
廣告計費方式
- 按次收費 Pay-Per-Impression, PPI
每次有人觀看廣告就收小額費用。通常以每一千人為付費單位,故也被稱作「千人成本 Cost-Per-Mille, CPM」。 - 付費點擊 Pay-Per-Click, PPC
每次有人真的按下廣告,才跟廣告商收費,也被稱作「點擊成本 Cost-Per-Click, CPC」。
#5 雲端服務
雲端服務(Cloud Services)是指透過網際網路提供如伺服器、儲存空間、資料庫、軟體等運算資源的模式。企業或個人無需自行購置實體硬體,可隨需求(On-demand)取用,並按使用量付費、能節省維護成本並提高彈性。常見類型包含 IaaS(基礎架構)、PaaS(平台)及 SaaS(軟體)。
SaaS、IaaS、PaaS
- SaaS(發音為sass), software-as-a-service 軟體即服務,租借軟體的商業模式。定義是
使用者在網路上訂閱軟體,並且透過網路配送得商業模式。其實Dropbox、Spotify、Gmail都是SaaS的案例,換句話說SaaS只是在雲端執行的應用程式的另一個名字。 - IaaS, infrastructure-as-a-service 基礎建設即服務,如AWS。比較白話的說是租借一個工具。
- PaaS, platform-as-a-service 平台即服務,提供某些額外的功能如資料庫、進階分析、整個作業系統。讓使用者只要傳送程式碼,就會在最少的設定需求下,自動幫使用者建立網站。PaaS沒有知名案例。
SaaS像是一間餐廳,顧客跟服務生點餐,然後餐點就會送到顧客面前。
IaaS租用餐廳及廚房,但需要自己帶食材及設備,自己煮飯給自己吃。
PaaS介於兩者之間,顧客提供食材及與料理方式,接者會有食物送到顧客面前。
雲端的風險
- 安全性:現在大多數的雲端服務供應商到擁有難以置信的堅強防護。例如Google的資料中心有褲質化的電子門卡、警報、車輛通行障礙、圍籬、金屬偵測器、生物資訊辨識、雷射光侵入偵測等等。基本上放在雲端的確比放在家裡的電腦安全。
- 隱私:法院曾多次嘗試要Google和微軟交出存放在伺服器的電子郵件,為了保持信用,Google和微軟持續與這些要求對抗。
- 網路連線:如果沒有網路連線就會失去生產力。故很多應用程式正朝向離線使用進行開發工作。
#6 租借軟體服務
為什麼你不能再擁有Photoshop
2013年Adobe改為免費下載Photoshop,但是要持續使用,需要訂閱他們新服務——創意雲端Creative Cloud。這個模式運作,使用者必須輸入授權碼,接者Photoshop會連線到Adobe的伺服器,檢查授權碼是否有效,同時會每個月檢查使用者是否持續付費。值得注意的是,Photoshop仍然是完全在使用者的電腦上執行,只是會雲端檢查是否有訂閱。
SaaS對Adobe的優點
- 賺取穩定收入,而不是等每幾年一次的重要版本更新才有收入。一年內Adobe多了70%的收入。
- 對抗盜版:每個月的授權檢查代表Adobe可以決定哪些人才能使用軟體。
- 方便更新及軟體修正。
Adobe轉為SaaS的爭議
一開始很多顧客不滿,覺得Adobe此舉是搶錢。
但慢慢平息怒氣的原因:
- 持續更新不需要額外花錢。
- 有利於新使用者:有一個月的免費試用,且第一年的費用是240美元,比起最後一個盒裝版本700美元便宜許多。
- 免費存放檔案在雲端,讓使用者可以在任何裝置進行編輯。
#7 租借伺服器服務
AWS, Amazon Web Service 亞馬遜網路服務租借伺服器服務,允許使用者租借Amazon的伺服器。AWS實際上是一組應用程式組合,當中最主要的服務是
(1) 彈性運算雲 Elastic Computer Cloiud, EC2——允許使中者在Amazon的伺服器上執行自己的程式碼
(2) 簡易儲存服務 Simple Storage Service, S3——讓使用者將應用程式資料存放在Amazon伺服器。當使用AWS來開發應用程式時,其所使用的工具跟Amazon使用的是一樣的。
- AWS不是唯一廠商,但佔了雲端運算服務市場的34%,是其他競爭者的三倍。
競爭者如微軟的Azure、Google的雲端平台。這三家都允許應用程式開發人員使用該公司的相同科技。例如YouTube是建立及執行在Google雲端平台。
成為AWS使用者的優點
- 建立與管理伺服器的費用非常龐大。一家新創公司若要建議自己的伺服器需要支付100萬美元,但如果租借AWS服務,每月只需支付25000美元。對Amazon來說也可以藉由規模經濟降低成本。
- 安全性:AWS的安全防護比自己建立的有保障。
- 可靠性:AWS對於網站的持續運行很有一套,AWS會保存好幾個應用程式與資料的副本在世界各地獨立的資料中心,當作備份。
Netflix如何處理暴增的觀眾?
2008時Netflix使用自身的伺服器,但接下來幾年,他們慢慢轉移到AWS服務,並在2016完全轉移過去。這七年他們基本上重新建立了基礎設施與資料庫,這是個巨大任務,但最終是值得的,雲端給予Netflix很巨大的優勢。
- 彈性:當Netflix使用自身的伺服器時,必須擁有足夠多的伺服器以解決尖峰時間的流量。尤其很少使用者會一整天都在看劇,大部分都是離峰時間,伺服器就處於閒置狀況代表浪費錢。但是AWS可以使用者彈性使用,選擇打開或是關閉,使用者只需要支付實際有使用的運算力費用。
- 擴充性:生意量沒有上限,只需要租借更多的伺服器。
- 可靠性:雲端資料會對資料與程式碼建立很多「冗餘」,或是很多備份。即使有部分電腦出問題,也還有其他電腦可以接手。



















