更新於 2023/08/04閱讀時間約 21 分鐘

各具特色的AI 聊天機器人

raw-image

自從去年ChatGPT 問世後,各家科技巨頭也紛紛推出自己的AI 聊天機器人,期望跟上AI 帶來的風潮。而今天馬克鎖定OpenAI 跟兩家發展不到兩年即獲得10億融資的新創,帶大家認識三個獨具特色的聊天機器人── ChatGPT 作為聊天機器人的帶領者,Pi 被譽為最友善的聊天機器人,Claude2 則是三觀最正確且閱讀量最大的聊天機器人。懷著各自的色彩,讓我們深入探索這些聊天機器人的獨特之處,並一窺未來聊天機器人發展的無限可能性吧!


AI新時代:聊天機器人

AI聊天機器人使用先進的 ML 算法和 NLP 技術,能夠理解人類的語言並自然地回答。從ChatGPT 問世後,各大科技巨頭也紛紛推出自家AI 聊天機器人,各有各的顯著功能與特色。AI 聊天機器人最大的優勢是它可以與人交流,將人的「輸入」轉換成相對應的指示,也進入我們的日常生活中,從協助完成作業、撰寫社交媒體貼文、品牌經營,到教育、醫療、客服等領域皆被廣泛應用。

AI聊天機器人的未來影響將是深遠的,為各個領域帶來重大改變。接下來的文章,馬克挑選三家專門做AI 聊天機器人的公司 ─ OpenAI、Inflection AI 與Anthropic 跟公司各自推出的AI 聊天機器人 ─ ChatGPT、Pi、Claude 2作為主題,瞄準語言模型的帶領者以及後浪兩家創立不到2年但融資皆超過10億的新創,帶大家一窺不同公司對其聊天機器人的產品定位與期望。

ChatGPT,作為聊天機器人的帶領者,憑藉OpenAI 的GPT-3.5 架構,擁有無限的想像力和知識深度,如同和一位聰明的伙伴對話。Pi,被譽為最友善的聊天機器人,其專為人性化交流而設計,迷人之處在於他的高度情商跟同理心,能理解情感和需求,並用溫暖的回應互動,彷彿擁有一位真正的朋友。Claude2,最安全的聊天機器人,對於其產出的正確性跟無害性高度要求,同時也是能讀取最大量檔案的聊天機器人。

這三位聊天機器人的出現,展示了聊天機器人領域的多樣性,無論是開放性的探索、友好的陪伴,還是安全性的要求。隨著技術的進步,這些聊天機器人將有更廣闊的發展潛力,可能在教育、醫療、商業等領域扮演更重要的角色。

OpenAI

簡介/成立背景/主要目標

OpenAI 是一間專攻人工智慧的企業,2015年由特斯拉執行長跟推特新老闆馬斯克(Elon Musk),以及創投Y Combinator前總裁亞特曼(Sam Altman)創立,2018年馬斯克因與特斯拉有潛在利益衝突選擇離開公司。

OpenAI 希望能夠讓通用人工智慧(artificial general intelligence,簡稱AGI,或是強人工智慧Strong AI)造福所有人類,致力打造安全且對人類有助益的AGI。常見說法通用人工智慧的特別之處在於能像人類一樣具備認知能力,並擁有接近或超越人類的邏輯推理,甚至擁有自我意識。

歷年產品

OpenAI 最初專注在影片、電動等娛樂相關的AI,創立不到一年即發表用於開發強化學習(RI)的開源工具包OpenAI Gym。2018年OpenAI 發表關於GPT 的機器學習模型,簡化概念類似於人腦,有許多神經網路,並根據輸入(大型數據集合)訓練後產生輸出(用戶詢問後的答案)。2019年OpenAI 從非營利轉為營利性質,2021年推出名為Dall-E 的生成式AI 模型,用來分析人類的自然語言文本,並根據文本中的內容生成圖像。再來就是2022年11月推出驚豔全球的ChatGPT,因其革命性的技術跟嵌入用戶日常的高使用率備受矚目。

其他產品包含GPT-3 強大語言模型基礎以分析人類生成的文本並學習生成類似的字句,Dall-E 和Dall_E2 分析用戶描述的字句並以此生成圖像,CLIP 為結合視覺效果跟文本的神經網路,能夠從不同類型的數據(如圖像和文本)學習,Codex 生成代碼協助軟體開發簡化攥寫程式過程,Whisper 是語音識別工具,可以識別、轉錄跟翻譯約100種不同語言的語音。

主要產品─ChatGPT

ChatGPT 是由OpenAI 所開發的一種基於人工智慧技術的對話系統。其核心是一種語言模型,稱為GPT (Generative Pre-trained Transformer)。這種模型是通過大量的訓練數據訓練而成,能夠理解自然語言的結構和語義,並可以生成自然流暢的語言。

(延伸閱讀:https://www.markreadfintech.com/p/chatgpt-250

核心服務

ChatGPT 定位:
最被廣泛使用的AI聊天機器人與領導者

特色:
1、文本撰寫能力優秀
2、可要求程式編寫
3、資訊彙整能力強
4、定義角色+目標+產出=有效的指令
5、資料不完全正確

目前ChatGPT 有兩個版本:免費版和付費版。付費版的價格為每個月20美元,資料皆更新至2021年。儘管ChatGPT 在三者中可能不是最強大的版本,但它是目前被廣泛使用的。據OpenAI 的CEO Sam Altman 表示,在ChatGPT 發佈後的5天內,已經吸引了100萬用戶使用。

核心技術

有篇名為《Attention is all you need》的科研論文探討Transformer 的算法,論文指出傳統的深度學習算法對數據量要求很高,這也造成當數據量較少時難以有效訓練模型的問題。為了解決這個問題,學術界和產業界提出了許多方法,其中一種叫做GAN(生成對抗網路),可以通過快速生成假數據來補足真實數據,從而增加數據量。

Transformer 是更高級的神經網路深度學習算法,可以從小數據中抽取重要訊息並有效抽樣,還可以透過補足真實數據的方法來快速生成大數據,因此在人工智能和深度學習扮演重要角色。

(延伸閱讀:夜讀 | ChatGPT背後的核心技術 | uSMART

用戶回饋

1、在編程中ChatGPT 的實際用途
https://www.makeuseof.com/chatgpt-programming-practical-uses/
2、OpenAI 官方釋出11款ChatGPT 外掛(網頁尾端)
https://www.businessweekly.com.tw/international/blog/3011255

InfectionAI

簡介/成立背景/主要目標

人工智慧初創公司Inflection AI 在今年六月底宣布成功從微軟、輝達等知名投資者籌集了13 億美元的資金,將其估值提升至約40 億美元。這家公司成立僅一年,總部位於加州,由Google旗下AI 研究公司DeepMind 的聯合創辦人蘇萊曼(Mustafa Suleyman)和專業社群平台LinkedIn 的聯合創辦人霍夫曼(Reid Hoffman)於2022年三月共同創立。

Inflection AI 在今年五月正式宣布推出名為Pi 的新型聊天機器人,其標誌性的人性對話跟從生產工具擴張為朋友的角色定位,也讓使用者猜測他將為AI 領域掀起第二波的革命,並成為目前最熱門的AI 公司OpenAI 的主要競爭對手。

該公司目前有約35 名員工,在2022 年初曾從Greylock、微軟和霍夫曼等投資者那裡籌集了2.25億美元的資金。這筆龐大的募資額將有助於Inflection AI 進一步拓展其人工智慧技術和業務,並在AI 領域中發揮更大的影響力。Inflection AI 的成立得到了矽谷巨頭的支持,顯示出他們對這家新創公司的潛力和發展前景充滿信心。

主要產品─Pi 聊天機器人

https://heypi.com/talk
Pi 目前免費支援多種語言,包括英文、西班牙文、法文、德文、義大利文和葡萄牙文,也可以在Instagram、Facebook Messenger、WhatsApp 等多個平台上使用Pi,同時還有適用於手機應用程式的版本。

Inflection AI 是一家致力於開發個人智能助理(personal intelligence)的新創公司,推出了名為 「Pi」的聊天機器人,這是一個擁有類似於ChatGPT 的生成式AI 技術的智能助理,透過對話與使用者互動。Inflection AI 的目標是打造一個功能強大的個人AI,可以幫助使用者規劃、安排、整理資訊,並且執行其他各種任務。

在六月底Inflection AI 發布了驅動Pi 的模型 Inflection-1 的報告,宣稱它的性能超越許多現有模型。Pi 的特點是能夠進行 「natural flowing conversation」,即更加自然流暢的對話交流。Inflection AI 表示,他們相信未來每個人都會擁有自己的個人人工智能,而 Pi 可以成為人們的教練、知己、創意合作夥伴、參謀和私人助理,提供全方位的支持與協助。這家公司受到了矽谷巨頭的支持,期望在AI領域發揮更大的影響力。

核心服務

Pi 定位:最友好的聊天機器人
特色:
1. 跨平台能記得與使用者的先前對話
2. 專注在自然流暢的對話交流
3. 不寫文本、論文、程式
4. 訓練成富有同理心,能夠權衡選項與避免爭吵

Pi 是一款多功能的聊天機器人,能夠聊幾乎任何話題。不論使用者需要解答問題、獲取資訊、尋求建議,或只是輕鬆閒聊,Pi 都能提供協助。Pi 的特色在於它還具有卓越的記憶力,可以從過往的對話中學習,以提供更高品質、人性化的互動體驗。在對話上可明顯感受到這個AI 機器人很喜歡說話,跟制式的一問一答相比Pi 表現出好奇心與自學,並藉由記得同個使用者100個對話使對話跟貼近真實。

Inflection AI 旨在改變人類與最新技術互動的方式。Pi 不寫電子郵件、論文和程式,也不畫圖。他的使命是考慮使用者的個人需求、習慣和興趣,提供所需的訊息,如同私人助理甚至是朋友。「對很多人來說,被傾聽很重要。他們需要一個工具來讓他們知道有人確實在傾聽他們的聲音。我們唯一擔心的是人們不會與 Pi 開始戀愛關係。」「最重要的是不要忘記這是人工智能。即使很人性化,但仍然沒有活著。」創辦人蘇萊曼說道。

Pi 和ChatGPT 的主要功能存有差異。ChatGPT 是一個文本生成器,能夠根據提示生成大量文本,適用於製作文章、論文和故事等。而Pi 則專精於自然流暢的對話交流,能夠理解使用者的輸入並作出相應回應,並根據需求和喜好調整對話內容。簡單來說,可以將ChatGPT 視為高級文本生成器,而Pi 則是獨特優雅的聊天夥伴。

核心技術

CoreWeave 與新創公司 Inflection AI 合作開發一個有 3584 個 H100 GPU 的雲端服務集群,由 CoreWeave 負責營運。集群功能強大,11分鐘內就完成了大規模的GPT-3訓練基準測試。

Inflection AI 利用這個高效能集群做為他們首個AI 聊天機器人「Pi」的大型語言模型。執行長蘇萊曼表示,這個模型是在CoreWeave擁有強大的H100 GPU網路上進行訓練的。

Inflection AI於2022年初創立後,計畫與CoreWeave合作,使用NVIDIA的GPU建立全球最大的運算集群之一。

跟ChatGPT 的比較

在人工智慧領域,ChatGPT 和Inflection AI 的聊天機器人Pi 都是非常受歡迎的AI 助手。然而他們之間的主要差異,就是訓練數據和對話風格。

ChatGPT 主要通過在網路上收集的大量文本數據進行訓練,這些數據包括書籍、新聞文章和網站內容。這種訓練方式使ChatGPT 在生成文本方面表現出色,能夠根據提示生成大量的文字,如文章和故事。但缺點是這些訓練數據大多是單向的,缺乏真實的對話交流。

相比之下Inflection AI 的開發團隊更注重訓練Pi 進行文本對話。他們使用大量對話數據,像是人們之間的真實對話,使Pi 能夠更自然、更像真人的方式回應使用者的輸入,並且能夠根據對話的上下文進行適應性調整。Pi 還能從與使用者和其他用戶的對話中學習,進一步改進其回應。隨著時間的推移,Pi 將變得越來越智能,能夠更好地理解和滿足使用者的需求。

用戶回饋

Pi 展現同理心並讓使用者感受到被支持,實際或抽象情感的問題都可以與之訴說,並得到非常真實的情感支持。使用情境很廣,根據使用者的分享可大致整理成當你需要說話的時候、當靈感不夠的時候、當必須做出艱難決定時、當需要個人生活教練時、當能量或信心降至低谷時,Pi 都能以他所訓練的方式為使用者提供協助。Pi 被訓練成富有善意跟同理心,並能產生創造性的解決方案,同時以不同角度考慮事情權衡利弊。當需要鍛鍊或從事新職業時Pi 也能夠協助制訂規劃跟開始實施,過程中也能巧妙避免衝突,或是高情商的回應。Pi 的口語訓練也可以讀懂大部分流行詞或厘語等。Pi 的回應品質也很取決於使用者的提問方式,當問題越清晰詳細時,Pi 越能聚焦的清楚回答。

Anthropic

簡介/成立背景/ 主要目標

Anthropic 是一家專注於人工智能安全研究的公司,由創辦人兼CEO Dario Amodei 於2021年創立。他曾是 OpenAI 的研究人員,但三年前微軟首次投資OpenAI 後他認為這會使公司更加商業化,可能偏離對AI 安全性的要求,和公司的發展方向分歧也促使他決定離開OpenAI 的團隊。

Anthropic相信人工智能的影響可能與過去的工業和科學革命相當,但也會面臨挑戰。主要目標是展示穩定且以安全為導向的研究成果,這些成果對整個人工智能社區都有價值。Anthropic 認為未來十年內人工智能可能會帶來巨大影響,由於人工智能技術持續進步,訓練人工智能系統所需的計算量將急速增長,人工智能系統在智力任務上表現超越人類水平,但同時也可能帶來不確定性,人類將不確定如何讓這些系統在各種情況下都能表現穩健且無害。

為了應對這些挑戰,Anthropic 致力於多方面、基於經驗的人工智能安全方法。他們構建可靠的安全系統,包括研究擴展監督、機械可解釋性、面向過程的學習,以及理解和評估人工智能系統的學習和泛化能力。他們希望推動這項安全工作,並開發一個全面的安全研究框架,從容易解決的挑戰到更複雜的安全問題,都得到適當的關注和解決。

主要產品─Claude、Claude2

定位:三觀正確、閱讀量最大的聊天機器人
特色:
1. 數據更新到 2023 年年初
2. 可輸入 100K token 的內容長度
3. 可上傳多個檔案,同時詢問多個內容
4. 重視安全性與無害性

Anthropic 的創辦人由於對大型模型的安全性理念與OpenAI 存在分歧,集體離開OpenAI並創立了Anthropic。他們開發的Claude 2持續迭代,大大提高模型的安全性和無害性,降低了產生冒犯或危險性輸出的機率。在內部的紅隊評估中,員工對模型在有害提示上的表現進行評分,並定期進行人工檢查。Claude 2 在無害回應方面的表現比其前身Claude 1.3 提高了2倍。

Anthropic 採用稱為Constitute AI 的技術框架來實現對語言模型的無害化處理。這種自動化的方式效率更高,也能更有效地排除人類偏見,相比傳統的RLHF無害化方式更為優越。Claude 2 是Anthropic AI 開發的大型語言模型,作為Claude AI聊天機器人的基礎,於2023 年第一季度推出,強調流暢和創造性的對話,同時重視安全性。Claude在設計階段就將安全性作為重要考慮,與一些其他人工智能語言模型不同。

核心服務

Claude 2 是Anthropic 開發的大型語言模型,相較於之前的版本,在程式碼、數學和推理方面都有了顯著的提升。最重要的改進之一是輸入和輸出的長度增加。Claude 2 支持最多100K個token的上下文,讓它能夠閱讀大量技術文檔,甚至整本書。它的回答也更長,可以寫出幾千個token 的備忘錄、信件和故事。根據Anthropic 的官方論文,Claude 2目前雖然只支持100k,但是未來將會擴展到至少200k。

它還在多個測試中的得分明顯優於之前的版本,如Codex HumanEval(Python函數合成)、GSM8k(小學數學問題)、MMLU(多學科問答)、QuALITY(非常長的故事問答測試,最多一萬個token)、ARC-Challenge(科學問題)、TriviaQA(閱讀理解)和RACE-H(高中閱讀理解和推理)等。

核心技術

這次Claude 2的提升主要得益於它的核心技術——Constitute AI,這個技術可以讓Claude 2更加智能和安全。

Constitute AI 可分成兩大部分。第一部分是讓Claude 2 透過一組原則和示例來自我評估跟改進回答。有點像是 Claude 2 在學習過程中反思自己的錯誤並不斷進步。這些原則和示例是指定給Claude 2 的準則,讓它知道什麼樣的回答是好的,什麼樣的是不好的,並根據這些準則自我調整。

第二部分是強化學習,可想像成Claude 2 在學習過程中如遊戲獲得獎勵一樣。它不依賴於人類回饋,而是利用AI 生成的回饋選擇更無害的輸出。目的是讓Claude 2 在沒有人類指導也能夠自主學習,回應更安全的回答。

研究人員將人類回饋視為Claude 的最重要和最有意義的評估指標之一,使用人類偏好數據計算每個任務的Elo 分數,用於比較性能。Claude 在幫助性、誠實性和無害性評估中的得分表現出色。Constitute AI 讓Claude 2 可以更好的理解問題,同時提高其安全性和準確性。

(參考資料:Claude 安全性檢驗測評參考資料

Anthropic 人工智能研究的三種類型

Anthropic進行了三種不同類型的人工智能研究:

1、能力研究
該類型研究旨在使人工智能系統在各種任務上變得更出色,例如寫作、圖像處理、遊戲等,改進大型語言模型的效率或強化學習也屬於這一類別。儘管能力研究可以推進人工智能的進步,但Anthropic 選擇不發布此類成果,因為他們希望避免過快提高人工智能能力的速度。他們更關注對前沿能力的深思熟慮,並優先將模型用於安全研究而不是公共部署

2、一致性能力研究
該類型研究的目標是開發新算法,使人工智能系統更有幫助、更誠實、更無害,並且符合人類價值觀。這包括辯論、擴展自動紅隊、憲法人工智能、去偏見和根據人類反饋進行強化學習(RLHF)。這些技術通常有實用性和經濟價值,但不一定是必然的,有時可能只有在人工智能系統變得更強大時才能派上用場。


辯論:開發人工智能系統能夠參與辯論,並提供合理、有說服力的論點。
擴展自動紅隊:紅隊測試是模擬攻擊來測試系統的安全性,擴展自動紅隊則是開發更強大的測試技術,以提高人工智能系統的安全性和防範潛在威脅。
憲法人工智能:涉及制定原則和準則,讓人工智能系統的行為與我們社會的法律和道德要求保持一致。
去偏見:減少或消除人工智能系統中可能存在的偏見和歧視,確保其回答和決策是公平、中立的。
根據人類反饋進行強化學習(RLHF):強化學習是一種讓人工智能系統通過試錯學習的方法,這裡的RLHF是指利用人類的反饋來引導強化學習。


3、對齊科學
在這裡「對齊」指的是人工智能系統的行為和決策是否符合人類的價值觀和期望。當我們訓練和使用人工智能時,我們希望它們的表現能夠符合我們社會的價值觀,並且不會產生不受控制或不符合道德的行為。該領域專注於評估和理解人工智能系統是否真正對齊,這包括機械可解釋性對語言模型進行評估紅隊測試影響函數研究等。


機械可解釋性:理解人工智能系統的決策和行為背後的原因
對語言模型進行評估:確保其回答是真實可信且無害
紅隊測試:模擬攻擊來測試系統弱點
影響函數研究:探討人工智能系統如何將其學到的知識應用於新的情況

這三種類型的研究使得Anthropic能夠從不同角度探索和發展人工智能技術,並且更全面地考慮其安全性和符合性。

馬克碎念

隨著AI聊天機器人的興起,其對金融產業未來的影響令人期待。AI 聊天機器人的語言能力,將可應用於客服與理財建議等領域,協助處理查詢或提供個人化服務。特別是客戶服務方面,AI 聊天機器人已展現擬人化交流的潛力,能夠根據上下文對話,並記住用戶偏好,提供更人性化的服務體驗。此外大型語言模型也能分析非結構化資料,擴展金融機構的客戶洞察力。透過AI 深入理解每個客戶的特殊需求,金融機構可提供更有效的產品設計和風險評估。

然而,AI 聊天機器人的應用也存在風險。語言模型存在偏見或錯誤資訊的可能,金融機構必須確保AI 系統具備適當的道德標準和控制機制。同時隨著AI聊天機器人迅速發展,對公司安全管理與法規遵循提出更高要求。金融科技公司需要採取積極措施,建立AI 安全和控管政策,以發揮AI 的正面影響力。只有審慎看待AI的優缺點,AI 才能真正為金融服務帶來突破。

分享至
成為作者繼續創作的動力吧!
© 2024 vocus All rights reserved.