非常有榮幸在2023年末,參與了 UserXper 悠識學院 舉辦的《2023 AI for better UX 實務研討》,並獲選擔任此次講座的筆記手一同記錄難得可貴活動。今年隨著 ChatGPT 在全球爆紅, 讓相關的 AI 人工智慧話題熱度持續發酵。身為從事 UX 相關工作的團隊夥伴們,藉此思索著如何趁勢利用 AI 技術協助 UX 工作,不僅提升工作效率並且能夠提供給使用者更好體驗。這場講座有幸邀請六位來自各國際知名科技企業資深產品負責人與設計經理、設計主管。帶來了AI 產品開發實務經驗和設計流程的變化,以及 UI/UX 設計師在 AI 時代下,該如何調整自身定位發揮能力。整個講座進行約五小時多,共四個主題分為上下半場,每場結束有安排講者座談,與本次參與與會者們進行深度討論互動。
重點整理:
▍AIGC 的發展進程
1950s ~ 1990s 萌芽期:生成音樂
1990s ~ 2010s 積累期:生成文本
2010s ~ Now 發展期:生成圖像、影片、文本大規模應用
▍AGI HHH 提出的三原則解決 AI 亂回答的問題
有用的 Helpful:解決使用者問題,使其滿意。
誠實的 Honest:真實的內容,沒有謬誤。
無害的 Harmless:正向,有道德規範內的內容。
▍AI 訓練的核心在於如何整合人類由外而內的行為。
對人的認知構成:人格、特質、意圖、情緒。
本質人格 ⇒ 個性特質 ⇒ 目標意圖 ⇒ 情緒表徵。
▍AI 是怎麼生成圖像的呢?
生成式對抗網路(Generative Adversarial Networks, GAN)
擴散模型(Diffusion)
對比式語言 圖像預訓練(Contrastive Language-Image Pre-Training, CLIP)
▍如何控制好生成圖像,大概率得到預期結果?
善用冒號和逗號,並具體的敘述:形、色、質、構。
▍設計師會不會被 AI 取代?
講者透過悲傷的五個階段來闡述,第一張攝影照片對藝術界的衝擊影響。
過去的我們網路參考和設計工具產出草稿進行提案,
如今可以藉由 AIGC 產生過去無法想像的視覺,甲方需要五彩斑斕的黑。
▍後 Agent 時代
點:互動 API
線:體驗 Agent
面:服務 Multi-Agent
講座的開場 Richard 講述雖是年末該總結今年學習的時候,但是 AI 不斷發生變化更促使不斷學習。不同以往舉辦的講座,本次參與與會者資深從業者5年以上佔了一半以上,可望在與講者座談時有更實務經驗上的互動。
從基礎大模型看 AIGC 釋放設計創造力
林居穎 Kyle(Alibaba 通義實驗室 產品體驗設計負責人)
1950年 Alan Turing 提出“圖靈測試”,機器產生智能的想法第一次被提出
1957年 第一支由電腦創作的交響樂《伊利亞克組曲》發布1997年 AI 深藍擊敗西洋棋世界冠軍1976年 全球第一個 AI 醫療專家系統 MYCIN 問世1979年 AI 首次打敗人類雙陸棋世界冠軍
1997年 AI 深藍擊敗西洋棋世界冠軍
2006年 深度學習理念正式提出2007年 世界上第一部 AI 創作小說《1 TheRoad》問世2012年 首個全自動同聲傳譯系統問世
2013年 微軟小冰上市
2018年 StyleGAN 模型上線,AI 可實現圖片生成2019年 DeepMind 實現 AI 視片生成2022年 ChatGPT 上線,實現大規模應用普及
關於人工智慧生成內容(Artificial Intelligence Generated Content, AIGC)發展歷程,從最早 1957年 Lejaren Hiller 和 Leonard Issacson 兩位教授,編寫了世界上第一首完全由電腦生成的音樂作品《伊利亞克組曲 The Illiac Suite》開始萌芽,接著到積累期 AI 生成文本,2007年創作第一部小說 《1 The Road》,到現在發展期 2022年 ChatGPT 上線,大規模應用。
資料來源:增长黑盒《2023中国AIGC应用研究报告》
生成式預訓練模型(Generative Pre-trained Transformer, GPT),藉由統計學背後運算邏輯來預測回答問題,有可能造成負面回應,像是亂編答案、資訊偏誤或廢話連篇不知所云的狀況,那麼要如何解決 AI 亂回答的問題呢?AI 開發團隊提出了很多方法,最核心仍根據 AGI HHH 提出的三原則,HHH 是 Anthropic 推廣的一個框架。與人類偏好保持一致,以滿足使用者和企業的需求。
GPT 3.5
GPT 4
所有的生成訓練都需要數據層和模型層,若來自公開網路資訊,可能造成胡說八道的結果,因此需要人工標註或是真實回饋意見的資料庫。
訓練 AI 的核心在於如何整合人類由外而內的行為,從關注智商到關注情商,讓 AI 更人性化。對人的認知構成:人格、特質、意圖、情緒。以石頭放上動動眼為例,比起沒有眼睛的石頭更多了生命感,來自於人對於生命感的腦補。
好比認識他人,一開始從對他人外在行為,逐漸進一步熟知。但是人自己的表達是由內而外,在成長背景和經驗中不斷積累形成特質和行為。對 AI 訓練是從內和外之間找到一個交集。程序化的流程:本質人格(Core Personality) ⇒ 個性特質(Personality Traits) ⇒ 目標意圖(Purpose) ⇒ 情緒表徵(Emotion Expression)。例如十六型人格測驗(Myers-Briggs Type Indicator, MBTI)為 ESFP 的表演型人格,拆解出個性特質為外向樂群、輕鬆興奮、直率、世故等等關聯參數,針對關鍵場景做目標意圖定義,進入被誇獎情境會得到什麼樣的回覆,再引導到數位設備或是數位角色,呈現出情緒表徵,歡樂語音、激動表情、開心的文字、蹦蹦跳跳行為等等。在設計訓練算法上需要不斷與「算法訓練模型」對齊目標。
有生成器和判別器需要訓練,生成器(Generator)被訓練用來生成假資料,判別器(Discriminator)則被訓練如何辨別資料真偽。當生成器生成人像時有些生成很矬,與真實人像一同經過判別器去區分哪些是真實人像。生成器和判別器不斷迭代進化,到最後生成器能夠生成到非常真實能騙過判別器的時候,那麼演算法的訓練就完成了。讓生成器和判別器對抗產生正向的影響。
使用高斯雜訊對影像進行編碼。還有逆擴散的過程來重現影像。但是逆擴散的過程其實非常不穩定。而命名為 Stable Diffusion 就是意欲嘗試變穩定。
藉由圖像與使用者認知是否匹配吻合來訓練。例如判斷一隻貓在一隻狗的頭上,是否與圖像認知匹配或不匹配。
人類的產出需要經驗/技法、理解力、需求。相對 AI 的產出需要數據集、模型、指令(Prompt)。沒有足夠的數據,就像人一樣沒有經驗和技法;沒有良好的理解力,就像人一樣不能懂得將需求轉化;沒有精準的表達力,就像不會描述需求的甲方一樣。理解 AI 「先不要」像和人對話一樣和機器對話,AI 還沒有想像中那麼聰明,AI 對於文字引申涵義或暗喻隱喻仍不足。輸入就像 google 關鍵字搜尋方式善用冒號和逗號,並「具體」的敘述。例如上圖將句子分段逗號,”looking at me”, “laughing at me” 能讓生成圖像呈現正面。
1826年 Joseph Nicéphore Niépce 拍攝名為《在萊斯格拉的窗外景色》(View from the Window at Le Gras)出現的第一張攝影照片對藝術界的衝擊影響,讓畫家們開始否認與憤怒控訴難登大雅之堂,慢慢開始討價還價與沮喪寫實沒有前景,最後承認接受,影響藝術界而出現印象派、野獸派各多流派。相對如今人們覺得 AI 做的也不怎麼樣。講者認為階段演進可能比我們想像中快,很快地在工作上,需要與 AI 協作了。
過去的我們在前期靈感階段,透過 Behance、dribbble、pinterest 來找參考圖,再藉由 Adobe設計軟體、Sketch、Figma 等設計工具來構思創意,產出草稿進行提案。確認方向後,後期設計執行階段,更進一步透過設計工具細部完善,最終定稿。如今我們在前期靈感階段,可以藉由 AIGC 類型網站直接生成形成草稿。最後後期設計執行階段,除了傳統工具外還可以藉由 AIGC 類型網站直接生成效果好,可直接使用的設計稿。例如甲方需要五彩斑斕的黑,如今可以藉由 AIGC 產生過去無法想像的視覺,讓人人可以釋放更多創意。
Agent 可以想成是仲介般,幫你討價還價的代理人。只要給它目標,後續事情會幫你處理。這也是GPT 4 出來後的大模型發展方向。這部分講者提出的點、線、面概念,讓我聯想起顧客旅程地圖(Customer Journey Map, CJM),每個互動的接觸點連成旅程線,例如去咖啡廳買咖啡的過程,所經歷的體驗點,串成購買咖啡流程的線,而另個角度來看咖啡師製作咖啡流程也是個線。所有的流程線,整體形成面性服務。轉換成 Agent ,點就是API 那些特定關鍵任務、線就是你請它倒咖啡,它會串連很多 API 來達成。面就是透過 Multi-Agent 來完善更好的服務。
具備單一 AI 技能,使用者主動透過 AI 完成任務(文件掃描、會議記錄、翻譯、問答…)
可以如同人類助手般,在單一領域完成多工複雜任務(產出會議摘要、整理文件大綱與翻譯、報告輸出…)
基於大數據計算與決策模型,協助人們進行複雜決策(基於日常數據給出大大小小的決策輔助)
Richard 在講座結尾講述 AI 是一種產品,像是汽車引擎,沒有人懂熱力物理原理但是不會畏懼,並應用來產生價值,AI+ 可以附加在很多地方,汽車引擎作為工具能應用很多地方,如汽車、卡車…。 +AI 通用型 AI 結合產業知識可以產生新的商業模式,像是郵務、外送、物流…。今天內容有 AI+與需要清理數據有關,也一部分 +AI 通用型生產力工具,促使我們去思考什麼樣的行業問題,適合 AI 去解決。
主題:從基礎大模型看 AIGC 釋放設計創造力
講者:林居穎 Kyle | 前 Roblox AI 資深產品負責人
時間:Dec. 16, 2023 13:40–14:20
在 AI 時代下,設計師該如何深入本質,調整定位,利用 AI 而不是被 AI 利用,去做好本職工作,發揮更大的能力?本分享將從 AIGC 的發展切入,拆解影像基礎演算法的演進,再到新一代設計模式的討論。 幫助大家見微知著,擁抱 AIGC 設計新時代