生成式學習是生成有結構的複雜物件,包含文句、影像、語音等。通過學習大量的數據,從而可以生成與原始數據相似的新數據。它主要依賴深度學習技術,其中最常見的是生成對抗網路、Transformer模型。
其原理是透過生成網路(Generative Network)與鑑別網路(Discriminating Network)進行博弈競賽,使生成器學習到如何生成更加真實的數據,而鑑別器則可以不斷提高辨識真假數據的能力,並透過反覆訓練讓系統不斷進化。
Transformer是一種非常強大的神經網絡模型,它可以用於自然語言處理、圖像處理、音頻處理等各種生成式任務。使用了一種被稱為自注意力機制(self-attention)的技術,這種技術可以幫助模型更好地理解輸入數據,而 現在廣為人知ChatGPT就是用Transformer模型進行訓練的。Transformer模型能夠自動從數據中學習知識,並生成適當的回答。
對Transformer有興趣的同學,推薦看李宏毅老師的介紹
https://www.youtube.com/watch?v=hYdO9CscNes&ab_channel=Hung-yiLee
https://www.youtube.com/watch?v=gmsMY5kc-zw&ab_channel=Hung-yiLee
可用於自動寫作、文本生成、對話、翻譯和摘要生成等,亦能夠生成特定風格和語境或者故事,以滿足讀者的需求和興趣。
可依照使用者需求生成圖像,創造成全新的成品,如新的藝術作品、設計元素、簡報設計等,亦可用於圖像修復、風格轉換、圖像合成等應用。
可改善傳統影片的製作過程,能夠一鍵自動剪輯,提高效率並降低成本,亦可用於影片特效生成、動畫生成,產生更高質量的視覺效果。
可以學習音樂的節奏、旋律和和弦結構,並生成原創的音樂片段,可用於在音樂創作、廣告音樂和背景音樂生成等領域。
可透過學習和模仿現實世界中的語音特色,來創建非常擬真的語音輸出,能應用語音助手、語音提示、語音小說和自動語音回應等應用。
加重個資外洩的疑慮,2022年6月到今年5月,將近一年的時間,據統計超過10萬筆以上ChatGPT個資遭到竊取,甚至被放上非法暗網兜售,而災情最嚴重的地方就是亞太地區。
加劇深假技術的威脅,如駭客可能會用 ChatGPT針對不同企業,產生數萬封釣魚郵件後,再運用偽造聲紋假冒財務長致電財務人員進行匯款。
企業資訊可能在資料餵養的過程中,外洩給其他使用者甚至是競爭對手,以及若服務平台遭破壞而產生漏洞,攻擊者將有機會存取內部系統權限。多家企業目前是禁止或有條件的使用 ChatGPT,如蘋果、三星、台積電等。據資料安全服務商 Cyberhaven統計,旗下企業用戶共160萬名員工的使用行為,已有8.2%員工在職場使用 ChatGPT,其中有3.1%將不能外流的企業機敏資料上傳到 ChatGPT服務上。
社會中出現大量出現文字陳述不精確或陳腔濫調、內容存在常見刻板印象、充斥著大國的社會文化概念,偏離事實或完全虛假的內容,讓「事實」難以求證。ChatGPT 雖設有基本的安全與道德圍牆,犯罪、恐怖主義、種族歧視、仇恨言論、性騷擾等不道德的問題會被拒絕回答,但在透過問題的誘導下仍會被成功誘導而進行答覆。
歐盟近日通過的《人工智慧法》草案(A.I. Act)是首個針對人工智慧的綜合性法案,包括生物辨識技術、臉部辨識技術、社會評分系統等,並且針對科技公司如何使用大數據訓練人工智慧模型進行規範,禁止在大型語言模型(如 OpenAI的 GPT-4)的訓練集中使用任何「受版權保護」的資料。
根據《紐約時報》報導,紐約曼哈頓一名律師史瓦茲日前在處理一起2019年哥倫比亞航空糾紛時,史瓦茲利用 ChatGPT引述6起相關判例,將其統整為10頁的報告提交給法庭,表示訴訟應持續推進。結果哥倫比亞航空委託律師發現,怎麼找都查不到史瓦茲提出的判例,這才發現6起判例竟然全都是 ChatGPT「憑空捏造」。
為了阻止 AI擾亂司法秩序,德州聯邦法官要求任何出庭的律師都必須提出「文件的任何部分都不是由生成式AI起草」的證明,或者如果是,則必須證明該文件必須受過「人工」檢查。
目前生成式AI在金融行業的應用主要聚焦於智慧客服與智慧顧問服務兩個部分。
智慧客服方面,客戶可以透過自然語言處理技術,使用語音或文本與 AI系統進行互動,輕鬆獲取有關金融產品和服務的資訊,並進行相應的操作。若AI經過訓練後,學習大量金融知識庫、產品服務及一般應答方式,是有可能可以完全取代金融人工客服,讓客戶無須再耗費大量時間在櫃檯等候人工服。
智慧顧問服務方面,AI系統能夠記住客戶的喜好,透過對客戶標籤、 交易屬性等多類資料進行分析和研究,精確地針對廣大金融消費者的需求,對目標客群開展不同層次、不同手段的服務模式,提供專屬的個人化顧問服務,進一步提升客戶服務體驗。
軟體新創 Gogolook在旗下的「袋鼠金融」,推出全台第一個以生成式AI架構發展的金融知識智能問答服務:Roo AI,成功將生成式AI應用推入金融業,雖然目前還是Beta版本,但用戶已能使用該問答服務,目前涵蓋信貸、信用卡、數位帳戶、證券、理財相關多元的金融知識服務。透過用戶回饋持續調校優化 LLM模型,一共使用了超過1千篇、累積400萬字的金融文章和200多項金融商品資訊訓練模型,讓生成內容能夠符合臺灣消費者金融需求的回答。
補充:我個人有跑去試用看看了,回覆次數每日最多 10 則,雖然在回覆上我認為是有待提升,但我還是非常期待這項服務的後續發展,有興趣的也可以去試試看!
https://roo.cash/roomy/ask?source=Blog&medium=Content&content=roo-ai-intro&ts=1688703504405
Gogolook創立於 2012 年,以開發陌生來電辨識軟體 Whoscall 出發,目前已在日本、韓國、泰國、馬來西亞、香港與巴西等全球七個重點市場,提供數位防詐及風險管理服務。秉持著「Build for Trust」的核心理念,建立起東亞及東南亞最大防詐資料庫。全球市場年均複合增長率預估介於 18 至 22% 之間,市場規模總值更超過 2,500 億美金,展現龐大的市場商機。
事實上,台大電機系李宏毅老師就曾用「文字接龍」模型形容 ChatGPT這類的 AI語言模型,透過高達三千億個字詞的大量資料訓練,並藉由「機率」預測下一個字應該出現什麼,ChatGPT並不會自動搜尋資料庫,每一個字的生成都像擲骰子一樣,是從過往大量訓練資料中,隨機生成它認為最合理的回答。簡單來說這類模型生成出來的答案並不能和正解劃上等號,在回答時不免會出現捏造虛假的情況。正是如此,在使用的同時,需要查核資料的真實性、謹慎的使用它所帶給我們的資訊,成為自己的守門人。