《2023 AI for better UX 實務研討:從基礎大模型看 AIGC 釋放設計創造力》講座心得#1

更新於 發佈於 閱讀時間約 15 分鐘

非常有榮幸在2023年末,參與了 UserXper 悠識學院 舉辦的《2023 AI for better UX 實務研討》,並獲選擔任此次講座的筆記手一同記錄難得可貴活動。今年隨著 ChatGPT 在全球爆紅, 讓相關的 AI 人工智慧話題熱度持續發酵。身為從事 UX 相關工作的團隊夥伴們,藉此思索著如何趁勢利用 AI 技術協助 UX 工作,不僅提升工作效率並且能夠提供給使用者更好體驗。這場講座有幸邀請六位來自各國際知名科技企業資深產品負責人與設計經理、設計主管。帶來了AI 產品開發實務經驗和設計流程的變化,以及 UI/UX 設計師在 AI 時代下,該如何調整自身定位發揮能力。整個講座進行約五小時多,共四個主題分為上下半場,每場結束有安排講者座談,與本次參與與會者們進行深度討論互動。

重點整理:

AIGC 的發展進程
1950s ~ 1990s 萌芽期:生成音樂
1990s ~ 2010s 積累期:生成文本
2010s ~ Now 發展期:生成圖像、影片、文本大規模應用

AGI HHH 提出的三原則解決 AI 亂回答的問題
有用的 Helpful:解決使用者問題,使其滿意。
誠實的 Honest:真實的內容,沒有謬誤。
無害的 Harmless:正向,有道德規範內的內容。

AI 訓練的核心在於如何整合人類由外而內的行為。
對人的認知構成:人格、特質、意圖、情緒。
本質人格 ⇒ 個性特質 ⇒ 目標意圖 ⇒ 情緒表徵。

AI 是怎麼生成圖像的呢?
生成式對抗網路(Generative Adversarial Networks, GAN
擴散模型(Diffusion)
對比式語言 圖像預訓練(Contrastive Language-Image Pre-Training, CLIP

▍如何控制好生成圖像,大概率得到預期結果?
善用冒號和逗號,並具體的敘述:形、色、質、構。

▍設計師會不會被 AI 取代?
講者透過悲傷的五個階段來闡述,第一張攝影照片對藝術界的衝擊影響。
過去的我們網路參考和設計工具產出草稿進行提案,
如今可以藉由 AIGC 產生過去無法想像的視覺,甲方需要五彩斑斕的黑。

▍後 Agent 時代
點:互動 API
線:體驗 Agent
面:服務 Multi-Agent

講座的開場 Richard 講述雖是年末該總結今年學習的時候,但是 AI 不斷發生變化更促使不斷學習。不同以往舉辦的講座,本次參與與會者資深從業者5年以上佔了一半以上,可望在與講者座談時有更實務經驗上的互動。


從基礎大模型看 AIGC 釋放設計創造力

林居穎 Kyle(Alibaba 通義實驗室 產品體驗設計負責人)

▍ 關於 AIGC 的發展歷程

1950s ~ 1990s 萌芽期:生成音樂

1950年 Alan Turing 提出“圖靈測試”,機器產生智能的想法第一次被提出
1957年 第一支由電腦創作的交響樂《伊利亞克組曲》發布1997年 AI 深藍擊敗西洋棋世界冠軍1976年 全球第一個 AI 醫療專家系統 MYCIN 問世1979年 AI 首次打敗人類雙陸棋世界冠軍

1990s ~ 2010s 積累期:生成文本

1997年 AI 深藍擊敗西洋棋世界冠軍
2006年 深度學習理念正式提出2007年 世界上第一部 AI 創作小說《1 TheRoad》問世2012年 首個全自動同聲傳譯系統問世

2010s ~ Now 發展期:生成圖像、影片、文本大規模應用

2013年 微軟小冰上市
2018年 StyleGAN 模型上線,AI 可實現圖片生成2019年 DeepMind 實現 AI 視片生成2022年 ChatGPT 上線,實現大規模應用普及

關於人工智慧生成內容(Artificial Intelligence Generated Content, AIGC)發展歷程,從最早 1957年 Lejaren Hiller 和 Leonard Issacson 兩位教授,編寫了世界上第一首完全由電腦生成的音樂作品《伊利亞克組曲 The Illiac Suite》開始萌芽,接著到積累期 AI 生成文本,2007年創作第一部小說 《1 The Road》,到現在發展期 2022年 ChatGPT 上線,大規模應用。

資料來源:增长黑盒《2023中国AIGC应用研究报告


▍ 解決 AI 亂回答的問題

raw-image

生成式預訓練模型(Generative Pre-trained Transformer, GPT),藉由統計學背後運算邏輯來預測回答問題,有可能造成負面回應,像是亂編答案、資訊偏誤或廢話連篇不知所云的狀況,那麼要如何解決 AI 亂回答的問題呢?AI 開發團隊提出了很多方法,最核心仍根據 AGI HHH 提出的三原則,HHH 是 Anthropic 推廣的一個框架。與人類偏好保持一致,以滿足使用者和企業的需求。

  • 有用的 Helpful:解決使用者問題,使其滿意。
  • 誠實的 Honest:真實的內容,沒有謬誤。
  • 無害的 Harmless:正向,有道德規範內的內容。
raw-image

GPT 3.5

  • 數據層:專業標注人員數據;真實問答用戶數據 ⇒ 自動生成答案數據;真人排序的精品數據。
  • 模型層:監督微調(Supervised Fine Tuning, SFT) ⇐ 獎勵模型 (Reward Model, RM)。
  • 能力:API Plugin。

GPT 4

  • 多模態理解:Contrastive Language-Image Pre-Training。
  • 邏輯推理:Chain of Thought 。 講者舉例此類似放聲思考法
  • GPTs:Prompt Enginneering + Assistant API。

所有的生成訓練都需要數據層和模型層,若來自公開網路資訊,可能造成胡說八道的結果,因此需要人工標註或是真實回饋意見的資料庫。


▍ 對人的認知構成

訓練 AI 的核心在於如何整合人類由外而內的行為,從關注智商到關注情商,讓 AI 更人性化。對人的認知構成:人格、特質、意圖、情緒。以石頭放上動動眼為例,比起沒有眼睛的石頭更多了生命感,來自於人對於生命感的腦補。

  • 認識人格(由外而內):從人的末端行為,向上總結人的類型。
  • 人的表達(由內而外):從人的人格類型,向下約束末端行為。

好比認識他人,一開始從對他人外在行為,逐漸進一步熟知。但是人自己的表達是由內而外,在成長背景和經驗中不斷積累形成特質和行為。對 AI 訓練是從內和外之間找到一個交集。程序化的流程:本質人格Core Personality ⇒ 個性特質Personality Traits ⇒ 目標意圖Purpose ⇒ 情緒表徵Emotion Expression例如十六型人格測驗(Myers-Briggs Type Indicator, MBTI)為 ESFP 的表演型人格,拆解出個性特質為外向樂群、輕鬆興奮、直率、世故等等關聯參數,針對關鍵場景做目標意圖定義,進入被誇獎情境會得到什麼樣的回覆,再引導到數位設備或是數位角色,呈現出情緒表徵,歡樂語音、激動表情、開心的文字、蹦蹦跳跳行為等等。在設計訓練算法上需要不斷與「算法訓練模型」對齊目標。


▍ 人工智慧 AI 是怎麼生成圖像的呢?

生成式對抗網路說明圖

生成式對抗網路說明圖

生成式對抗網路(Generative Adversarial Networks, GAN)

有生成器和判別器需要訓練,生成器(Generator)被訓練用來生成假資料,判別器(Discriminator)則被訓練如何辨別資料真偽。當生成器生成人像時有些生成很矬,與真實人像一同經過判別器去區分哪些是真實人像。生成器和判別器不斷迭代進化,到最後生成器能夠生成到非常真實能騙過判別器的時候,那麼演算法的訓練就完成了。讓生成器和判別器對抗產生正向的影響。

Stable Diffusion

Stable Diffusion

擴散模型(Diffusion model

使用高斯雜訊對影像進行編碼。還有逆擴散的過程來重現影像。但是逆擴散的過程其實非常不穩定。而命名為 Stable Diffusion 就是意欲嘗試變穩定。

Contrastive Language-Image Pre-Training, CLIP. Screenshot from speaker’s presentation

Contrastive Language-Image Pre-Training, CLIP. Screenshot from speaker’s presentation

對比式語言 圖像預訓練(Contrastive Language-Image Pre-Training, CLIP)

藉由圖像與使用者認知是否匹配吻合來訓練。例如判斷一隻貓在一隻狗的頭上,是否與圖像認知匹配或不匹配。


▍ 如何控制好生成圖像,大概率得到預期結果?

將句子分段逗號,”looking at me”, “laughing at me” 能讓生成圖像呈現正面。

將句子分段逗號,”looking at me”, “laughing at me” 能讓生成圖像呈現正面。

人類的產出需要經驗/技法、理解力、需求。相對 AI 的產出需要數據集、模型、指令(Prompt)。沒有足夠的數據,就像人一樣沒有經驗和技法;沒有良好的理解力,就像人一樣不能懂得將需求轉化;沒有精準的表達力,就像不會描述需求的甲方一樣。理解 AI 「先不要」像和人對話一樣和機器對話,AI 還沒有想像中那麼聰明,AI 對於文字引申涵義或暗喻隱喻仍不足。輸入就像 google 關鍵字搜尋方式善用冒號和逗號,並「具體」的敘述。例如上圖將句子分段逗號,”looking at me”, “laughing at me” 能讓生成圖像呈現正面。

讓 AI 好理解的版本

  • 形:主體是什麼?
  • 色:色彩是什麼?
  • 質:環境、氣氛、燈光是什麼?怎樣的知名藝術風格?
  • 構:構圖是什麼?

▍ 如何訓練更好的模型?

訓練好模型的流程

訓練好模型的流程

  1. 定義標準:區別什麼是好的數據?什麼是髒的數據?
  2. 批量標註:人工方式找出好的和髒的數據。
  3. 機器學習預訓練:認識並分辨好的和髒的數據。
  4. 驗收效果:目標對齊則應用再大規模數據中;目標不對齊則重新進入標註流程。
  5. 大規模訓練:將庫中的所有數據,進行分類,將合格數據用於訓練。

▍ 設計師會不會被 AI 取代?

講者透過 Kubler-Ross 的悲傷的五個階段(The Five Stages of Grief)來闡述:

  1. 否認/隔離(Denial & Isolation):畫家們否認這不是藝術!
  2. 憤怒(Anger):畫家們控訴難登大雅之堂!
  3. 討價還價(Bargaining):越多素材有助創作效率。
  4. 沮喪(Depression):覺得寫實沒有前景。
  5. 接受(Acceptance):最後承認接受,影響藝術界而出現印象派、野獸派各多流派。

1826年 Joseph Nicéphore Niépce 拍攝名為《在萊斯格拉的窗外景色》(View from the Window at Le Gras)出現的第一張攝影照片對藝術界的衝擊影響,讓畫家們開始否認與憤怒控訴難登大雅之堂,慢慢開始討價還價與沮喪寫實沒有前景,最後承認接受,影響藝術界而出現印象派、野獸派各多流派。相對如今人們覺得 AI 做的也不怎麼樣。講者認為階段演進可能比我們想像中快,很快地在工作上,需要與 AI 協作了。

導入 AI 前後工作流程的差異

導入 AI 前後工作流程的差異

AIGC 時代的設計師該怎麼運用 AI 能力呢?

過去的我們在前期靈感階段,透過 Behancedribbblepinterest 來找參考圖,再藉由 Adobe設計軟體、SketchFigma 等設計工具來構思創意,產出草稿進行提案。確認方向後,後期設計執行階段,更進一步透過設計工具細部完善,最終定稿。如今我們在前期靈感階段,可以藉由 AIGC 類型網站直接生成形成草稿。最後後期設計執行階段,除了傳統工具外還可以藉由 AIGC 類型網站直接生成效果好,可直接使用的設計稿。例如甲方需要五彩斑斕的黑,如今可以藉由 AIGC 產生過去無法想像的視覺,讓人人可以釋放更多創意。


 後 Agent 時代

  • 點:互動 API
  • 線:體驗 Agent
  • 面:服務 Multi-Agent

Agent 可以想成是仲介般,幫你討價還價的代理人。只要給它目標,後續事情會幫你處理。這也是GPT 4 出來後的大模型發展方向。這部分講者提出的點、線、面概念,讓我聯想起顧客旅程地圖(Customer Journey Map, CJM),每個互動的接觸點連成旅程線,例如去咖啡廳買咖啡的過程,所經歷的體驗點,串成購買咖啡流程的線,而另個角度來看咖啡師製作咖啡流程也是個線。所有的流程線,整體形成面性服務。轉換成 Agent ,點就是API 那些特定關鍵任務、線就是你請它倒咖啡,它會串連很多 API 來達成。面就是透過 Multi-Agent 來完善更好的服務。


▍ 人工智慧 AI 的發展

1.0 智能學徒:

具備單一 AI 技能,使用者主動透過 AI 完成任務(文件掃描、會議記錄、翻譯、問答…)

2.0 智能助手:

可以如同人類助手般,在單一領域完成多工複雜任務(產出會議摘要、整理文件大綱與翻譯、報告輸出…)

3.0 智能顧問:

基於大數據計算與決策模型,協助人們進行複雜決策(基於日常數據給出大大小小的決策輔助)

Richard 在講座結尾講述 AI 是一種產品,像是汽車引擎,沒有人懂熱力物理原理但是不會畏懼,並應用來產生價值,AI+ 可以附加在很多地方,汽車引擎作為工具能應用很多地方,如汽車、卡車…。 +AI 通用型 AI 結合產業知識可以產生新的商業模式,像是郵務、外送、物流…。今天內容有 AI+與需要清理數據有關,也一部分 +AI 通用型生產力工具,促使我們去思考什麼樣的行業問題,適合 AI 去解決。


主題:從基礎大模型看 AIGC 釋放設計創造力
講者:林居穎 Kyle | 前 Roblox AI 資深產品負責人
時間:Dec. 16, 2023 13:40–14:20

在 AI 時代下,設計師該如何深入本質,調整定位,利用 AI 而不是被 AI 利用,去做好本職工作,發揮更大的能力?本分享將從 AIGC 的發展切入,拆解影像基礎演算法的演進,再到新一代設計模式的討論。 幫助大家見微知著,擁抱 AIGC 設計新時代


avatar-img
12會員
30內容數
留言0
查看全部
avatar-img
發表第一個留言支持創作者!
本篇參與的主題活動
在生成式AI與大型語言模型(Large Language Model, LLM)蓬勃發展下,有許多工具可以幫助我們學習與撰寫程式,這篇文章提供了實作範例與一些經驗,分享如何使用ChatGPT(免費的GPT-3.5)協助程式語言的學習,並且完成屬於自己的程式。
前幾個禮拜,AWS 舉行 Startup Day Taiwan。想當然爾,最熱門的主題非生成式 AI (Generative AI) 莫屬。既然 AWS 有現成的工具,身為一名工程師,自然看看無妨,這篇文章算是新手開箱文,會說明如何部署一套基礎模型,並使用 AWS SDK 與其互動。
前言 我在工作中沒有什麼機會接觸到機器學習,學生時期也沒有學習過相關知識。 作為一個業餘小白,我對機器學習非常感興趣。在自學的過程中,我逐漸意識到利用機器學習可以做很多有趣的事情。 因此,我決定嘗試使用 AWS SageMaker JumpStart 來實驗文字生成式繪圖 AI ,以了解機
最近玩到了一個我覺得很新奇有趣的軟體,叫做SillyTavern。 SillyTavern是專用於創建虛擬角色的AI聊天軟體,SillyTavern是TavernAI的分支,但SillyTavern走上了自己的路,加進了許多額外功能,並且仍在積極的持續更新中。 然後,可以色色!
「Prompt」這個詞是提示的意思,但為什麼需要提示呢? 當AI不理解我們的時候,勢必給出的回應並非準確的為我們解答,因此一個好的提示是非常重要的,就如同我們人與人之間的溝通一樣,如何將自己心裡的疑惑轉化成好的問題來提問對方,讓對方理解,進而給出一個明確的答案,這就是提示(Prompt)的重要性,對
在生成式AI與大型語言模型(Large Language Model, LLM)蓬勃發展下,有許多工具可以幫助我們學習與撰寫程式,這篇文章提供了實作範例與一些經驗,分享如何使用ChatGPT(免費的GPT-3.5)協助程式語言的學習,並且完成屬於自己的程式。
前幾個禮拜,AWS 舉行 Startup Day Taiwan。想當然爾,最熱門的主題非生成式 AI (Generative AI) 莫屬。既然 AWS 有現成的工具,身為一名工程師,自然看看無妨,這篇文章算是新手開箱文,會說明如何部署一套基礎模型,並使用 AWS SDK 與其互動。
前言 我在工作中沒有什麼機會接觸到機器學習,學生時期也沒有學習過相關知識。 作為一個業餘小白,我對機器學習非常感興趣。在自學的過程中,我逐漸意識到利用機器學習可以做很多有趣的事情。 因此,我決定嘗試使用 AWS SageMaker JumpStart 來實驗文字生成式繪圖 AI ,以了解機
最近玩到了一個我覺得很新奇有趣的軟體,叫做SillyTavern。 SillyTavern是專用於創建虛擬角色的AI聊天軟體,SillyTavern是TavernAI的分支,但SillyTavern走上了自己的路,加進了許多額外功能,並且仍在積極的持續更新中。 然後,可以色色!
「Prompt」這個詞是提示的意思,但為什麼需要提示呢? 當AI不理解我們的時候,勢必給出的回應並非準確的為我們解答,因此一個好的提示是非常重要的,就如同我們人與人之間的溝通一樣,如何將自己心裡的疑惑轉化成好的問題來提問對方,讓對方理解,進而給出一個明確的答案,這就是提示(Prompt)的重要性,對
你可能也想看
Google News 追蹤
Thumbnail
嘿,大家新年快樂~ 新年大家都在做什麼呢? 跨年夜的我趕工製作某個外包設計案,在工作告一段落時趕上倒數。 然後和兩個小孩過了一個忙亂的元旦。在深夜時刻,看到朋友傳來的解籤網站,興致勃勃熬夜體驗了一下,覺得非常好玩,或許有人玩過了,但還是想寫上來分享紀錄一下~
Thumbnail
「Embrace AI to unlock a new era of efficiency, unleashing creativity and marketing infinite potencial.」擁抱AI,開啟效率新時代,釋放創意與行銷無限潛力
Thumbnail
最新的AI趨勢讓人眼花撩亂,不知要如何開始學習?本文介紹了作者對AI的使用和體驗,以及各類AI工具以及推薦的選擇。最後強調了AI是一個很好用的工具,可以幫助人們節省時間並提高效率。鼓勵人們保持好奇心,不停止學習,並提出了對健康生活和開心生活的祝福。
Thumbnail
隨著ChatGPT問世以來,AI持續在不同領域上發揮作用。虛擬人已能代理人類完成特定任務,是新興科技從工具擴展至落地應用服務的關鍵產物。 透過觀察AI如何賦能Web3的發展,以及觀測各種國際創新應用案例,請參加此免費研討會,了解「虛擬人應用發展趨勢」和「從AI賦能Web3新興應用看發展趨勢」二個議題
Thumbnail
AIGC,全名是人工智能生成內容(AI-generated content),指的是使用人工智能技術自動生成的各種數字內容。這些內容可以包括文本、圖像、音樂、視頻、程式碼等等。AIGC利用自然語言處理(NLP)、計算機視覺、機器學習和深度學習等技術來創建和生成這些內容。
Thumbnail
人工智慧(AI)時代的到來,並不代表要取代人類的工作,而是要幫忙人類釋放雙手,集中在內心的成長上。透過閱讀阿卡西和運用AI工具,可以為個人的成長增添新的力量。
Thumbnail
ChatGPT 自2022年11月問世以降,開啟了生成式AI (Generative AI,也稱AIGC, AI Generated Content) 技術和應用的爆炸性發展。本篇文章提供了各種類型的AIGC工具整理,從個人助理到繪圖再到研究類一應俱全,幫助您提高生產力。
Thumbnail
第 19 天:使用 ChatGPT 完成了哪 3 個任務? 這幾年真的人人都在討論 AI,在我工作的產業裡,也有不少設計師擔心未來會被 AI 取代。 但我認為,AI 就像一個得力助手,可以幫助人們更快完成庶務,給我們更多時間思考更多可能~
Thumbnail
2023年被視為AI元年,自媒體創作因AI技術爆炸式增長。本文探討AIGC技術和個人心態的突破,以及作者在自媒體創作上的轉變和情感體驗。此外,作者分享了使用各種AI工具的樂趣和實用性,供讀者參考。
Thumbnail
嘿,大家新年快樂~ 新年大家都在做什麼呢? 跨年夜的我趕工製作某個外包設計案,在工作告一段落時趕上倒數。 然後和兩個小孩過了一個忙亂的元旦。在深夜時刻,看到朋友傳來的解籤網站,興致勃勃熬夜體驗了一下,覺得非常好玩,或許有人玩過了,但還是想寫上來分享紀錄一下~
Thumbnail
「Embrace AI to unlock a new era of efficiency, unleashing creativity and marketing infinite potencial.」擁抱AI,開啟效率新時代,釋放創意與行銷無限潛力
Thumbnail
最新的AI趨勢讓人眼花撩亂,不知要如何開始學習?本文介紹了作者對AI的使用和體驗,以及各類AI工具以及推薦的選擇。最後強調了AI是一個很好用的工具,可以幫助人們節省時間並提高效率。鼓勵人們保持好奇心,不停止學習,並提出了對健康生活和開心生活的祝福。
Thumbnail
隨著ChatGPT問世以來,AI持續在不同領域上發揮作用。虛擬人已能代理人類完成特定任務,是新興科技從工具擴展至落地應用服務的關鍵產物。 透過觀察AI如何賦能Web3的發展,以及觀測各種國際創新應用案例,請參加此免費研討會,了解「虛擬人應用發展趨勢」和「從AI賦能Web3新興應用看發展趨勢」二個議題
Thumbnail
AIGC,全名是人工智能生成內容(AI-generated content),指的是使用人工智能技術自動生成的各種數字內容。這些內容可以包括文本、圖像、音樂、視頻、程式碼等等。AIGC利用自然語言處理(NLP)、計算機視覺、機器學習和深度學習等技術來創建和生成這些內容。
Thumbnail
人工智慧(AI)時代的到來,並不代表要取代人類的工作,而是要幫忙人類釋放雙手,集中在內心的成長上。透過閱讀阿卡西和運用AI工具,可以為個人的成長增添新的力量。
Thumbnail
ChatGPT 自2022年11月問世以降,開啟了生成式AI (Generative AI,也稱AIGC, AI Generated Content) 技術和應用的爆炸性發展。本篇文章提供了各種類型的AIGC工具整理,從個人助理到繪圖再到研究類一應俱全,幫助您提高生產力。
Thumbnail
第 19 天:使用 ChatGPT 完成了哪 3 個任務? 這幾年真的人人都在討論 AI,在我工作的產業裡,也有不少設計師擔心未來會被 AI 取代。 但我認為,AI 就像一個得力助手,可以幫助人們更快完成庶務,給我們更多時間思考更多可能~
Thumbnail
2023年被視為AI元年,自媒體創作因AI技術爆炸式增長。本文探討AIGC技術和個人心態的突破,以及作者在自媒體創作上的轉變和情感體驗。此外,作者分享了使用各種AI工具的樂趣和實用性,供讀者參考。