數據污染與AI(一)

更新於 2023/07/26閱讀時間約 4 分鐘


楊道還 7/14/2023

(一)

AI是今年特大的一個新聞,但也是特別詭異的一個。資本家們一邊努力地推廣,一邊又大聲地警告,十分不尷尬。這就像開著大奔進胡同裡的農貿市場,一邊鳴笛,一邊前進;一邊擠了市場裡的攤位,一邊又提供了推車、修車和擦車的新行當——司機都在跳車。

日前又有新聞、新名詞、新信息,叫做AI數據污染。這是更尷尬的一個問題,但不新,是個老問題。數據污染在自然科學裡,是原始數據被污染羼入或被缺失,損害了其完整性和真實性。

這個新聞說,AI在網上抓人類數據,結果抓回來的原始數據,卻被AI自己生產的數據羼入了。AI的腦瓜和鍵盤比人的快,一句問題,可以頂上一萬句。所以這個污染一旦出現,規模該不小,不是前AI時代的宣傳和廣告所能比的。英文裡,有misinformation,misknowledge,AI的數據污染應該有個新名詞,叫misdata或misdatum。名不正,則言不順。

如果以上估計正確,繼知識爆炸和信息爆炸之後,會有這個AI導致的數據爆炸。爆炸越來越深入,也算一個自然的進程。諾貝爾之獎,被稱為炸藥獎,莫非前定?

之所以說自然,還因為misinformation不是disinformation或者malinformation,沒有主觀的故意。即AI仍不能算是個真人,仍然是個機器。當AI能有主觀的故意時,它才能像個人一樣負起責任。現下看來,AI沒有主觀故意卻可能導致錯誤,這樣的錯誤,沒有專家願意承擔,只能由社會的非專家承受,主要是那些對警告聽不太懂的門外漢們,譬如筆者。

AI算不算是個真人,怎麼算?圖靈測試?圖靈說,如果一台機器能夠與人類展開對話(透過電傳設備)而不被辨別出其機器身份,那麼稱這台機器具有智慧。那個時代的機器,懂得的東西很少,但是純粹理性和邏輯的,不犯錯;但稱不上智慧。現代有人認為,人只有完全理性和按照邏輯思考,才算是有智慧。如果這兩者成立的話,那麼那個時代的機器與人的差距就只在於知識量。是這樣嗎?填鴨式地喂給機器數據和信息,它就會生出知識來,以至於生出智慧來麼?當然,沒那麼簡單,還得有個人為的算法輸進去,直到AI能自己源源不斷地產生算法。但大方向似乎就是這樣的。結果將是個智慧制造機。這有什麼值得警告的呢?malinformation?

但圖靈這句話翻成古文,就是一個機器「言足以飾非」,即為智慧。「言足以飾非」這句,前面還有一句「智足以拒諫」。加上這句,就反映了現在AI的真正狀態,它比你知道的多得多,它也能讓你分不出它是機器還是人,它犯了錯,眨眼的功夫就可以換個說法,一樣理直氣壯——算法錯了,它卻沒錯,不可追責。工程師們也不能擔其責,這就是加入集體的好處,兢兢業業的螺絲釘怎好有責?而監管、監管,如何監管?加芯片加電源。除了抱薪救火,有什麼別的法兒?

上面這兩句話從哪裡來的呢?司馬遷《史記·殷本紀》:「帝紂資辨捷疾,聞見甚敏,材力過人,手格猛獸,知足以距諫,言足以飾非;矜人臣以能,高天下以聲,以為皆出己之下。」好巧不巧的是,紂也是不可追責的。AI人士發出的警告,是因為這個原因麼?顯然AI還沒到這個地步。未來麼,不要想得太遠。

Misdata對AI來說,不完全是件壞事。這就像小孩子在成長的過程中,一邊吸收信息,一邊辨別虛假信息——無陰陽不成。有極端的人認為,神話什麼的,不理性,是不能教給孩子的。大概他們認為,用純粹事實(?)和理性邏輯教出來的孩子,對錯誤就百毒不侵了。這種方法或者能制造出成功的科學家,但他如何與他人相處,如何與不能永遠正確的自己相處?這是造AI的方法,然而即便對AI來說,從今開始,也屬過時了。所以Misdata對某些人類來說,也不完全是件壞事。

Misdata對AI來說,是個與同類相處的問題。或者這是AI能反思,有真正地進化,以至於接近人類思維的一個階段。人類從哪裡來?現代人類中,神創和自然的比例佔多少?人類交互影響、文化自進化的比例又佔多少?佛法講無情與有情,無情如何生有情?有情未現前,如何含於無情?當然,這些都是為AI專家擔憂,思出其位了,不贅述。

但這裡有個切近的問題,就是人腦能夠處理左一片,又一片信息的能力是有限的,拿這樣的左一坨、右一坨的數據怎麼辦?「真實」數據尚且處理不來,misdata怎處?雖說現代社會裡的人,數據、信息不厭多,像廣告一樣,不看就好了,但無處不在的廣告仍屬生命不能承受之輕。大概只能希望後代有個好運了。


avatar-img
7會員
33內容數
對現代科技、科技文明、哲學、和未來的反思。
留言0
查看全部
avatar-img
發表第一個留言支持創作者!
Daohuan Yang的沙龍 的其他內容
最近網上流傳一篇《孔子的理想世界》。這篇文章節選了孫震的《孔子新傳》。既雲節選,有點兒斷章取義也就理所當然。我寫這篇博文評論這篇文章,主要是梳理,也有消斷章歧義的意思。孫震這本書淺讀之下,已使我獲益良多。 這篇短文不是書評,而是有感而發。 (一) 文中節選了孫論述「孔子所處的
新右衛門問一休和尚,如果因聽從命令而造業,還屬自己造業否?一休說,院中樹上雪將樹壓彎了,去將雪掃掉來。須臾,新右衛門掃完雪回來。又問。一休說,誰的身上濕了? 新右衛門問一休和尚,如果因聽從命令而造業,還屬自己
孔孟理論中一個重要的發明是人倫。人倫是指人與人之間的關系及其原則。這裡的關系指施之於人而反之於己的輪轉關系。這些關系,最基本的,就是五種:父子,君臣,夫婦,長幼,朋友。其余的關系可以通過將這五種類比、組合、拼合、或湊合而成。
2050年,一個哲學系學生的文章被教授指是由AI生成。學生不服。學校組織了一個委員會聽證。現場記錄……
根據墨菲定律,人工智能如果可能被濫用,就一定會被濫用。在一般情形下的正常應用、好心的情形下,即便「無咎」,「事情變壞」也會發生。那麽人工智能的「事情變壞」會怎樣發生呢?這要從彼得原理來看。
兩個駐地球觀察站的外星人,湊在一起閑聊。 甲說:「這工作真無聊啊。」 乙說:「無聊是無聊,但現在工作條件好多了,上上他們的網,就可以了,知足吧。上個世紀,在外太空弄個破望遠鏡觀察地球,生活單調,工作更無聊,他們居然搞出了個『地球主要的生物是汽車,裏面爬滿了一種叫做人的寄生蟲
最近網上流傳一篇《孔子的理想世界》。這篇文章節選了孫震的《孔子新傳》。既雲節選,有點兒斷章取義也就理所當然。我寫這篇博文評論這篇文章,主要是梳理,也有消斷章歧義的意思。孫震這本書淺讀之下,已使我獲益良多。 這篇短文不是書評,而是有感而發。 (一) 文中節選了孫論述「孔子所處的
新右衛門問一休和尚,如果因聽從命令而造業,還屬自己造業否?一休說,院中樹上雪將樹壓彎了,去將雪掃掉來。須臾,新右衛門掃完雪回來。又問。一休說,誰的身上濕了? 新右衛門問一休和尚,如果因聽從命令而造業,還屬自己
孔孟理論中一個重要的發明是人倫。人倫是指人與人之間的關系及其原則。這裡的關系指施之於人而反之於己的輪轉關系。這些關系,最基本的,就是五種:父子,君臣,夫婦,長幼,朋友。其余的關系可以通過將這五種類比、組合、拼合、或湊合而成。
2050年,一個哲學系學生的文章被教授指是由AI生成。學生不服。學校組織了一個委員會聽證。現場記錄……
根據墨菲定律,人工智能如果可能被濫用,就一定會被濫用。在一般情形下的正常應用、好心的情形下,即便「無咎」,「事情變壞」也會發生。那麽人工智能的「事情變壞」會怎樣發生呢?這要從彼得原理來看。
兩個駐地球觀察站的外星人,湊在一起閑聊。 甲說:「這工作真無聊啊。」 乙說:「無聊是無聊,但現在工作條件好多了,上上他們的網,就可以了,知足吧。上個世紀,在外太空弄個破望遠鏡觀察地球,生活單調,工作更無聊,他們居然搞出了個『地球主要的生物是汽車,裏面爬滿了一種叫做人的寄生蟲
你可能也想看
Google News 追蹤
Thumbnail
*合作聲明與警語: 本文係由國泰世華銀行邀稿。 證券服務係由國泰世華銀行辦理共同行銷證券經紀開戶業務,定期定額(股)服務由國泰綜合證券提供。   剛出社會的時候,很常在各種 Podcast 或 YouTube 甚至是在朋友間聊天,都會聽到各種市場動態、理財話題,像是:聯準會降息或是近期哪些科
Thumbnail
当前,金融企业纷纷投资技术,以帮助其实现收入增长、成本节约和合规。SunGard将横跨金融服务领域的流程技术、金融产业和规章等专业知识与其它技术实践知识相结合,帮助企业实现目标。SunGard全球服务业务部可以帮助客户在构建、测试、集成和托管SunGard及第三方解决方案时简化其供应商关系。SunG
Thumbnail
中国房地产增长停滞,依附于新建楼房的电子产品市场萎缩。国家大力投资电子电路,替代进口芯片,国产芯片的价格已经很低。可以预见的,国内产业主要问题是寻找市场。与此同时,中国政府的一带一路政策,和众多公司的海外扩张,俄乌战争后乌克兰的从建等相关市场,都需要新的科技产品支撑。 这些变化,都促使依靠重复劳动的
Thumbnail
可能包含敏感內容
网上赢钱被黑客服各种理由不给提现出款怎么办? #网上被黑系统维护一直审核拒绝出款怎么办#网上平台赢钱被黑银行系统维护不给出款怎么办? #网上被黑 ..出黑QQ 477230471 飞机@hnyt09
Thumbnail
一,大趋势判断 我们认为使用信用级别超越国家概念的去中心网络、区块链存储技术,建构一个使用物联网技术对人的交易行为进行记录,并通过数据分析区分人的价值观(道德分级、信用等级),从而进行交易选择的平台是必然出现的。 二,国内物联网行业面临的危机 那么问题的目标很容易确定: 三, 模块化硬件的介绍
Thumbnail
网络安全技术人员Victor Gevers 发现中国包括人脸数据等大量数据库未加密,在互联网呈现裸奔状态。在人脸识别技术越发成熟的今天,其对应的数据库安全却远未及格,这无疑会为信息社会中的个人隐私安全埋下极深的炸弹。
Thumbnail
*合作聲明與警語: 本文係由國泰世華銀行邀稿。 證券服務係由國泰世華銀行辦理共同行銷證券經紀開戶業務,定期定額(股)服務由國泰綜合證券提供。   剛出社會的時候,很常在各種 Podcast 或 YouTube 甚至是在朋友間聊天,都會聽到各種市場動態、理財話題,像是:聯準會降息或是近期哪些科
Thumbnail
当前,金融企业纷纷投资技术,以帮助其实现收入增长、成本节约和合规。SunGard将横跨金融服务领域的流程技术、金融产业和规章等专业知识与其它技术实践知识相结合,帮助企业实现目标。SunGard全球服务业务部可以帮助客户在构建、测试、集成和托管SunGard及第三方解决方案时简化其供应商关系。SunG
Thumbnail
中国房地产增长停滞,依附于新建楼房的电子产品市场萎缩。国家大力投资电子电路,替代进口芯片,国产芯片的价格已经很低。可以预见的,国内产业主要问题是寻找市场。与此同时,中国政府的一带一路政策,和众多公司的海外扩张,俄乌战争后乌克兰的从建等相关市场,都需要新的科技产品支撑。 这些变化,都促使依靠重复劳动的
Thumbnail
可能包含敏感內容
网上赢钱被黑客服各种理由不给提现出款怎么办? #网上被黑系统维护一直审核拒绝出款怎么办#网上平台赢钱被黑银行系统维护不给出款怎么办? #网上被黑 ..出黑QQ 477230471 飞机@hnyt09
Thumbnail
一,大趋势判断 我们认为使用信用级别超越国家概念的去中心网络、区块链存储技术,建构一个使用物联网技术对人的交易行为进行记录,并通过数据分析区分人的价值观(道德分级、信用等级),从而进行交易选择的平台是必然出现的。 二,国内物联网行业面临的危机 那么问题的目标很容易确定: 三, 模块化硬件的介绍
Thumbnail
网络安全技术人员Victor Gevers 发现中国包括人脸数据等大量数据库未加密,在互联网呈现裸奔状态。在人脸识别技术越发成熟的今天,其对应的数据库安全却远未及格,这无疑会为信息社会中的个人隐私安全埋下极深的炸弹。