群眾外包:天才般的需求匹配,或世界級的偉大剝削

閱讀時間約 7 分鐘

〈群眾外包:天才般的需求匹配,或世界級的偉大剝削〉2023-11-15


  「巴拿馬運河和埃及金字塔,人類最宏大的專案需要十萬人的參與。」


  說話者名為Luis von Ahn。你可能並不認識這個看起來不太像英文的名字,但他在二十歲出頭就做出的一項發明,卻深刻地滲入到了網路時代中,影響了我們每個人的生活。


  當這名於2006年獲得麥克阿瑟獎金的年輕科學家與創新家說出「現在,在人類歷史上,我們將第一次能夠如此輕鬆地獲得所有這些數量的勞動力。想像一下如果我們有5億人,我們能夠做什麼?」時,他並不是在談論一種空洞的願景。而是,他真正地為世界帶來一種新的模式,讓全世界的無數人自願地、不知不覺地,每天為整體世界發展貢獻一部分自己的腦力與勞力。



  千禧年,網路的蠻荒時期。使用系統自動搶票的黃牛、大量註冊免費信箱發送垃圾郵件的不肖人士就已經在網路上大量出現。為了應對這項連當時的頂尖科技公司都束手無策的問題,在卡內基梅隆大學研究計算機科學與密碼學的路易斯.馮.安(Luis von Ahn),和伙伴一同提出了「全自動區分電腦和人類的圖靈測試(CAPTCHA,也就是俗稱的驗證碼)」的構想與系統。


  這項系統很快地被雅虎和其他網路公司使用。一方面有效地讓當時許多無法辨識圖像的簡單腳本難以發揮作用,另一方面,也讓我們這些人類,時常必須在登入帳號時,煩燥地辨識與輸入那些歪七扭八的字詞。



  隨著驗證碼的廣泛出現,路易斯意識到了這個系統對人類總體時間與腦力的浪費,同時看見了「輸入驗證碼」這項活動包含的潛力。於是,他開啟了「reCAPTCHA 計畫」,從這一刻起,那些顯示在我們面前的驗證碼圖像,將不再是隨機的亂碼,而是兩個有意義的單詞。


  他並不是要我們透過這些單詞來學英文(即便我們之後會發現,路易斯對人們學習語言的需求同樣有相當程度的重視),而是,他希望將這些人類為了對網站證明自己是人類而浪費掉的時間,拿來協助曠時費日的圖書數位化工作。雖然OCR(光學字元辨識)技術已經有一定的發展,但在當時,還是有大約20%的材料沒有辦法被確定地辨識出來。於是,我們輸入驗證碼的這個過程,就被媒合進了這項辨識工作之中。


  在那套系統當中,我們面前的兩個單詞,由一個OCR能夠辨識的單詞與一個它無法辨識的單詞來組成。系統會先判斷我們是否答對第一個單詞,如果我們答對,我們輸入的第二個單詞則會被「計點」。當點數足夠時,你與世界另一端的人們共同給出的答案便會被認為是正確的答案。


  於是,我們很長一段時間內都為發行了一百多年的《紐約時報》數位化做出了貢獻。並在reCAPTCHA被Google收購後,我們也開始為Google辨識街景、以及訓練AI辨識各式各樣的事物(譬如說:請在下列圖片中選出腳踏車)。也就是說,如果某一天自動駕駛電動車真的全面普及了,不客氣。



  這種將廣大用戶的微小行為與大規模計劃相互媒合的發想,讓路易斯在一些時候也被稱為「群眾外包之父」。不負這一稱呼地,在路易斯創立的另一間公司上,他也運用了這樣的思維。


  就像我們前面已經埋下的伏筆,路易斯的另一個目標是讓全世界的人都可以有機會免費學習外語。於是,已經成為計算機科學教授的路易斯與其研究生共同創立了一個語言學習平台,由拉丁語字根duo(兩個)和lingo(語言)組成的Duolingo(多鄰國)。在這裡,我們並不打算過多地談論多鄰國如何透過口耳相傳取得成功、甚至於2021在納斯達克掛牌上市。而是展示出,就連多鄰國的使用者,也已經在不知不覺間,參與了「群眾外包」。


  作為一個語言學習網站(程式),多鄰國在基本免費的條件下,提供了相當多樣的語言選擇。一開始,多鄰國僅提供了特定的幾種語言學習。而隨著用戶量的增加,這些用戶所提供的不同語言間的翻譯也持續增加。這些翻譯,則會反過來成為多鄰國提供新的語言學習課程的材料,讓它能夠更好地建構新課程,時至今日,上面已經累積了超過一百種不同的語言課程,並持續增加當中。


  同時,多鄰國也讓企業提供他們需要翻譯的文件,就像當時把需要數位化的文件分散地做成驗證碼圖像,這些文件也被分解成細小的翻譯練習題。用戶在練習翻譯的同時,也相當於主動提供多鄰國翻譯所需的勞力,讓它們能夠從需要文件翻譯的企業那裡得到相應的報酬。譬如CNN和BuzzFeed的網頁翻譯,都包含有多鄰國用戶的「熱心」參與。



  從創意和有效利用人力的角度來說,我們都不得不佩服路易斯這種「讓世界各地群眾共同成就大項目」的思維。但另一方面,如果多鄰國還可以說是「用戶主動想要學習外語與企業需要文件翻譯的各取所需」,reCAPTCHA對人類集體時間和勞動力的無償徵用,其實不能完全說是我們的「自願參與」。


  雖然說CAPTCHA替人們抵擋了一部分自動腳本,但與其說這是維護用戶的利益,更大程度上,也是在幫企業與網站解決問題。從當前的技術來說,透過偵測用戶按下「我不是機器人」時的滑鼠軌跡,其實已經可以很大程度辨識出用戶是否為人類。也有越來越多駭客程式能夠破解常見的reCAPTCHA內容。


  此時,早就超出路易斯原初構想,被Google收入囊中的reCAPTCHA,真的還是在「將人類浪費掉的時間用來做其他有價值的事」嗎?還是,Google正在利用這個其實不再需要,但我們已經逐漸習慣的行為,將每一個網路用戶都當成供它剝削的免費勞工?


  也許在這個過程中,我們真的共同成就了一些人類科技的重要進程,但不能不去問的是:我們有說我們要嗎?我們是否將過多的個人時間,在不知不覺中又送給了這些企業。





延伸閱讀:

〈那些被奪取的時間:前Google員工崔斯坦的反省〉

〈《誰偷走了你的專注力?》閱讀筆記(一):我們的行為已經被科技產品給重塑〉

〈預防小孩沉迷手遊:除了禁止,還能做些什麼?〉

〈如何讓自己成功地被賣出去?〉

〈睡夢中安詳離去的司機〉

〈大收購--動視暴雪對微軟的戰略價值〉




50會員
639內容數
一個寫作實踐,關於我看到和思考中的事情。
留言0
查看全部
發表第一個留言支持創作者!
前圖紙的沙龍 的其他內容
  在一次質問中,他的母親說到「你爸爸和我從來不會這樣到處張揚自己的性取向」。即便他的母親沒有注意到,但在這句她說出口時感到自然不過的話中,她其實清楚地表達了她和他老公的性取向。甚至,在這句話中,根據科爾維諾的分析,她還說了他們至少發生過了一次以上的性行為(科爾維諾俏皮地用手比著他自己)。
  不同於緣規、剪刀這些有其他正確用法的工具,從玩具刀的形狀、名稱、以及那些讓小孩子感興趣的短影音影響下,他們很容易去得到「可以用這個互戳」的印象。尤其,因為孩子知道這些玩具刀不像美工刀那樣銳利,「一般來說」不會讓別人受傷,反而更可能在玩得太high的情況下,不小心真的把人弄傷。
  我們的確有充分的理由去推廣、倡議、去指出其他想法從我們的角度看來的不足之處。但不同的聲音不可能一夕之間消失,也不見得應該要消失。那些聲音來自某些人,也許他們不理解一些事情、甚至他們可能帶有一定的敵意與惡意,但他們仍然首先是一些活生生的人,他們的言行仍然最初與最終地是基於某些他們心目中的合理理由。
  那些重複性高或模式性強的輕度「智力工作」將不再需要由人來處理。「按部就班完成義務教育後,按部就班地成為一個辦公室值員」的路徑將隨著時間的演進慢慢不再是典型的「普通人」生活方式。另一方面,那些更難被AI體現的,諸如照顧、服務、陪伴等工作的價值將有機會脫離當前這遠遠被低估的狀況,得到相對公允的重視。
  在「脫口秀」這一形式的保護下,女性或性少數得以有機會站在台上公開發表意見,而這是平常的社會中較為缺乏的場景。當她拿著麥克風,對台下訴說自己的經歷與觀點--尤其是終於有機會換她們對異性戀男性「品頭論足」的時候,這本身就成為了一件很有力量的政治行動。觀眾也開始有機會在一種相對安全的環境中意識到問題。
  場合形塑了一種氛圍,氛圍中的許多展現都與我們日常中會做出的行為截然不同。不僅僅是在那些明確的典禮、儀式、宴會。辦公室也是一個場合、大街上也是一個場合。下屬服從上司不合理的指令、行人在義交的催促下在斑馬線上奔跑。你心中知道不需要這麼做,但你讓身體成為命令的容器,推託掉為自己每一刻行為做決定的責任。
  在一次質問中,他的母親說到「你爸爸和我從來不會這樣到處張揚自己的性取向」。即便他的母親沒有注意到,但在這句她說出口時感到自然不過的話中,她其實清楚地表達了她和他老公的性取向。甚至,在這句話中,根據科爾維諾的分析,她還說了他們至少發生過了一次以上的性行為(科爾維諾俏皮地用手比著他自己)。
  不同於緣規、剪刀這些有其他正確用法的工具,從玩具刀的形狀、名稱、以及那些讓小孩子感興趣的短影音影響下,他們很容易去得到「可以用這個互戳」的印象。尤其,因為孩子知道這些玩具刀不像美工刀那樣銳利,「一般來說」不會讓別人受傷,反而更可能在玩得太high的情況下,不小心真的把人弄傷。
  我們的確有充分的理由去推廣、倡議、去指出其他想法從我們的角度看來的不足之處。但不同的聲音不可能一夕之間消失,也不見得應該要消失。那些聲音來自某些人,也許他們不理解一些事情、甚至他們可能帶有一定的敵意與惡意,但他們仍然首先是一些活生生的人,他們的言行仍然最初與最終地是基於某些他們心目中的合理理由。
  那些重複性高或模式性強的輕度「智力工作」將不再需要由人來處理。「按部就班完成義務教育後,按部就班地成為一個辦公室值員」的路徑將隨著時間的演進慢慢不再是典型的「普通人」生活方式。另一方面,那些更難被AI體現的,諸如照顧、服務、陪伴等工作的價值將有機會脫離當前這遠遠被低估的狀況,得到相對公允的重視。
  在「脫口秀」這一形式的保護下,女性或性少數得以有機會站在台上公開發表意見,而這是平常的社會中較為缺乏的場景。當她拿著麥克風,對台下訴說自己的經歷與觀點--尤其是終於有機會換她們對異性戀男性「品頭論足」的時候,這本身就成為了一件很有力量的政治行動。觀眾也開始有機會在一種相對安全的環境中意識到問題。
  場合形塑了一種氛圍,氛圍中的許多展現都與我們日常中會做出的行為截然不同。不僅僅是在那些明確的典禮、儀式、宴會。辦公室也是一個場合、大街上也是一個場合。下屬服從上司不合理的指令、行人在義交的催促下在斑馬線上奔跑。你心中知道不需要這麼做,但你讓身體成為命令的容器,推託掉為自己每一刻行為做決定的責任。
你可能也想看
Google News 追蹤
Thumbnail
這個秋,Chill 嗨嗨!穿搭美美去賞楓,裝備款款去露營⋯⋯你的秋天怎麼過?秋日 To Do List 等你分享! 秋季全站徵文,我們準備了五個創作主題,參賽還有機會獲得「火烤兩用鍋」,一起來看看如何參加吧~
Thumbnail
想發簡訊給自己經營的電商會員時,可以直接用大量簡訊平台一次發送。 但目前因為詐騙簡訊"盛行"的關係,申請這類平台的規則也變嚴格了,連自己的個資也要上繳給這些平台做身份驗證,所以還是找一些安全、有信譽的廠商,免得把自己的個資賣掉外,自己會員的個資也賣了。
Thumbnail
在流量為王的網路時代,有多少網路工作者被瀏覽數及追蹤數等數據所掌控? 又有多少人會以網路流量為評斷依據,判斷究竟一個人說出口的話「有沒有價值」? 在面對一項人事物時,不少人都容易簡單粗略地以「外在價值」來做評斷, 但價值其實不僅僅存在於外在、可量化的,更多的是隱藏在內、難以量化的深度價值。
Thumbnail
對抗情報操作的一個重點是協助人們取得缺少的拼圖,人們才能正確的拼出圖像,瞭解事件的原貌,以正確的思考。 以前各種藍白紅主打的重大民怨(快篩、疫苗、雞蛋、風電),都必須建立在民眾缺少某些拼圖,無法瞭解事件原貌的情況。 以二兆錢坑法案(AKA 台版一帶一路)來說,一個不反對的人通常缺乏以下幾塊拼圖:
今天要講一個比較進階的專利檢索項目,為了確認商品在預計販售的地區,沒有侵權疑慮,可以自由販賣,所以要針對商品的主要特徵去檢索,包含單一特徵、組合特徵,都要在選定區域逐一排查,才能避免商品技術遭控侵權而無法順利銷售。
Thumbnail
學術文化、數位科技,人工智慧發展的進步非常神速。海量的資訊迎面而來、各式各樣的創作成品,透過數位搜索工具,很容易被取得,也容易辨識作品是抄襲或原創。有志氣的寫作者都希望自己的成果越來越傑出,在各自領域出人頭地。抄襲是個罪行,很容易理解,也被絶大多數創作者視為不能觸碰的「天條」。 最
Thumbnail
這個秋,Chill 嗨嗨!穿搭美美去賞楓,裝備款款去露營⋯⋯你的秋天怎麼過?秋日 To Do List 等你分享! 秋季全站徵文,我們準備了五個創作主題,參賽還有機會獲得「火烤兩用鍋」,一起來看看如何參加吧~
Thumbnail
想發簡訊給自己經營的電商會員時,可以直接用大量簡訊平台一次發送。 但目前因為詐騙簡訊"盛行"的關係,申請這類平台的規則也變嚴格了,連自己的個資也要上繳給這些平台做身份驗證,所以還是找一些安全、有信譽的廠商,免得把自己的個資賣掉外,自己會員的個資也賣了。
Thumbnail
在流量為王的網路時代,有多少網路工作者被瀏覽數及追蹤數等數據所掌控? 又有多少人會以網路流量為評斷依據,判斷究竟一個人說出口的話「有沒有價值」? 在面對一項人事物時,不少人都容易簡單粗略地以「外在價值」來做評斷, 但價值其實不僅僅存在於外在、可量化的,更多的是隱藏在內、難以量化的深度價值。
Thumbnail
對抗情報操作的一個重點是協助人們取得缺少的拼圖,人們才能正確的拼出圖像,瞭解事件的原貌,以正確的思考。 以前各種藍白紅主打的重大民怨(快篩、疫苗、雞蛋、風電),都必須建立在民眾缺少某些拼圖,無法瞭解事件原貌的情況。 以二兆錢坑法案(AKA 台版一帶一路)來說,一個不反對的人通常缺乏以下幾塊拼圖:
今天要講一個比較進階的專利檢索項目,為了確認商品在預計販售的地區,沒有侵權疑慮,可以自由販賣,所以要針對商品的主要特徵去檢索,包含單一特徵、組合特徵,都要在選定區域逐一排查,才能避免商品技術遭控侵權而無法順利銷售。
Thumbnail
學術文化、數位科技,人工智慧發展的進步非常神速。海量的資訊迎面而來、各式各樣的創作成品,透過數位搜索工具,很容易被取得,也容易辨識作品是抄襲或原創。有志氣的寫作者都希望自己的成果越來越傑出,在各自領域出人頭地。抄襲是個罪行,很容易理解,也被絶大多數創作者視為不能觸碰的「天條」。 最