2024-11-15|閱讀時間 ‧ 約 0 分鐘

群眾外包:天才般的需求匹配,或世界級的偉大剝削

〈群眾外包:天才般的需求匹配,或世界級的偉大剝削〉2023-11-15


  「巴拿馬運河和埃及金字塔,人類最宏大的專案需要十萬人的參與。」


  說話者名為Luis von Ahn。你可能並不認識這個看起來不太像英文的名字,但他在二十歲出頭就做出的一項發明,卻深刻地滲入到了網路時代中,影響了我們每個人的生活。


  當這名於2006年獲得麥克阿瑟獎金的年輕科學家與創新家說出「現在,在人類歷史上,我們將第一次能夠如此輕鬆地獲得所有這些數量的勞動力。想像一下如果我們有5億人,我們能夠做什麼?」時,他並不是在談論一種空洞的願景。而是,他真正地為世界帶來一種新的模式,讓全世界的無數人自願地、不知不覺地,每天為整體世界發展貢獻一部分自己的腦力與勞力。



  千禧年,網路的蠻荒時期。使用系統自動搶票的黃牛、大量註冊免費信箱發送垃圾郵件的不肖人士就已經在網路上大量出現。為了應對這項連當時的頂尖科技公司都束手無策的問題,在卡內基梅隆大學研究計算機科學與密碼學的路易斯.馮.安(Luis von Ahn),和伙伴一同提出了「全自動區分電腦和人類的圖靈測試(CAPTCHA,也就是俗稱的驗證碼)」的構想與系統。


  這項系統很快地被雅虎和其他網路公司使用。一方面有效地讓當時許多無法辨識圖像的簡單腳本難以發揮作用,另一方面,也讓我們這些人類,時常必須在登入帳號時,煩燥地辨識與輸入那些歪七扭八的字詞。



  隨著驗證碼的廣泛出現,路易斯意識到了這個系統對人類總體時間與腦力的浪費,同時看見了「輸入驗證碼」這項活動包含的潛力。於是,他開啟了「reCAPTCHA 計畫」,從這一刻起,那些顯示在我們面前的驗證碼圖像,將不再是隨機的亂碼,而是兩個有意義的單詞。


  他並不是要我們透過這些單詞來學英文(即便我們之後會發現,路易斯對人們學習語言的需求同樣有相當程度的重視),而是,他希望將這些人類為了對網站證明自己是人類而浪費掉的時間,拿來協助曠時費日的圖書數位化工作。雖然OCR(光學字元辨識)技術已經有一定的發展,但在當時,還是有大約20%的材料沒有辦法被確定地辨識出來。於是,我們輸入驗證碼的這個過程,就被媒合進了這項辨識工作之中。


  在那套系統當中,我們面前的兩個單詞,由一個OCR能夠辨識的單詞與一個它無法辨識的單詞來組成。系統會先判斷我們是否答對第一個單詞,如果我們答對,我們輸入的第二個單詞則會被「計點」。當點數足夠時,你與世界另一端的人們共同給出的答案便會被認為是正確的答案。


  於是,我們很長一段時間內都為發行了一百多年的《紐約時報》數位化做出了貢獻。並在reCAPTCHA被Google收購後,我們也開始為Google辨識街景、以及訓練AI辨識各式各樣的事物(譬如說:請在下列圖片中選出腳踏車)。也就是說,如果某一天自動駕駛電動車真的全面普及了,不客氣。



  這種將廣大用戶的微小行為與大規模計劃相互媒合的發想,讓路易斯在一些時候也被稱為「群眾外包之父」。不負這一稱呼地,在路易斯創立的另一間公司上,他也運用了這樣的思維。


  就像我們前面已經埋下的伏筆,路易斯的另一個目標是讓全世界的人都可以有機會免費學習外語。於是,已經成為計算機科學教授的路易斯與其研究生共同創立了一個語言學習平台,由拉丁語字根duo(兩個)和lingo(語言)組成的Duolingo(多鄰國)。在這裡,我們並不打算過多地談論多鄰國如何透過口耳相傳取得成功、甚至於2021在納斯達克掛牌上市。而是展示出,就連多鄰國的使用者,也已經在不知不覺間,參與了「群眾外包」。


  作為一個語言學習網站(程式),多鄰國在基本免費的條件下,提供了相當多樣的語言選擇。一開始,多鄰國僅提供了特定的幾種語言學習。而隨著用戶量的增加,這些用戶所提供的不同語言間的翻譯也持續增加。這些翻譯,則會反過來成為多鄰國提供新的語言學習課程的材料,讓它能夠更好地建構新課程,時至今日,上面已經累積了超過一百種不同的語言課程,並持續增加當中。


  同時,多鄰國也讓企業提供他們需要翻譯的文件,就像當時把需要數位化的文件分散地做成驗證碼圖像,這些文件也被分解成細小的翻譯練習題。用戶在練習翻譯的同時,也相當於主動提供多鄰國翻譯所需的勞力,讓它們能夠從需要文件翻譯的企業那裡得到相應的報酬。譬如CNN和BuzzFeed的網頁翻譯,都包含有多鄰國用戶的「熱心」參與。



  從創意和有效利用人力的角度來說,我們都不得不佩服路易斯這種「讓世界各地群眾共同成就大項目」的思維。但另一方面,如果多鄰國還可以說是「用戶主動想要學習外語與企業需要文件翻譯的各取所需」,reCAPTCHA對人類集體時間和勞動力的無償徵用,其實不能完全說是我們的「自願參與」。


  雖然說CAPTCHA替人們抵擋了一部分自動腳本,但與其說這是維護用戶的利益,更大程度上,也是在幫企業與網站解決問題。從當前的技術來說,透過偵測用戶按下「我不是機器人」時的滑鼠軌跡,其實已經可以很大程度辨識出用戶是否為人類。也有越來越多駭客程式能夠破解常見的reCAPTCHA內容。


  此時,早就超出路易斯原初構想,被Google收入囊中的reCAPTCHA,真的還是在「將人類浪費掉的時間用來做其他有價值的事」嗎?還是,Google正在利用這個其實不再需要,但我們已經逐漸習慣的行為,將每一個網路用戶都當成供它剝削的免費勞工?


  也許在這個過程中,我們真的共同成就了一些人類科技的重要進程,但不能不去問的是:我們有說我們要嗎?我們是否將過多的個人時間,在不知不覺中又送給了這些企業。





延伸閱讀:

〈那些被奪取的時間:前Google員工崔斯坦的反省〉

〈《誰偷走了你的專注力?》閱讀筆記(一):我們的行為已經被科技產品給重塑〉

〈預防小孩沉迷手遊:除了禁止,還能做些什麼?〉

〈如何讓自己成功地被賣出去?〉

〈睡夢中安詳離去的司機〉

〈大收購--動視暴雪對微軟的戰略價值〉




分享至
成為作者繼續創作的動力吧!
© 2024 vocus All rights reserved.