各具特色的AI 聊天機器人

更新於 2023/08/04發佈於 2023/08/04閱讀時間約 21 分鐘

自從去年ChatGPT 問世後，各家科技巨頭也紛紛推出自己的AI 聊天機器人，期望跟上AI 帶來的風潮。而今天馬克鎖定OpenAI 跟兩家發展不到兩年即獲得10億融資的新創，帶大家認識三個獨具特色的聊天機器人── ChatGPT 作為聊天機器人的帶領者，Pi 被譽為最友善的聊天機器人，Claude2 則是三觀最正確且閱讀量最大的聊天機器人。懷著各自的色彩，讓我們深入探索這些聊天機器人的獨特之處，並一窺未來聊天機器人發展的無限可能性吧！

AI新時代：聊天機器人

AI聊天機器人使用先進的 ML 算法和 NLP 技術，能夠理解人類的語言並自然地回答。從ChatGPT 問世後，各大科技巨頭也紛紛推出自家AI 聊天機器人，各有各的顯著功能與特色。AI 聊天機器人最大的優勢是它可以與人交流，將人的「輸入」轉換成相對應的指示，也進入我們的日常生活中，從協助完成作業、撰寫社交媒體貼文、品牌經營，到教育、醫療、客服等領域皆被廣泛應用。

AI聊天機器人的未來影響將是深遠的，為各個領域帶來重大改變。接下來的文章，馬克挑選三家專門做AI 聊天機器人的公司 ─ OpenAI、Inflection AI 與Anthropic 跟公司各自推出的AI 聊天機器人 ─ ChatGPT、Pi、Claude 2作為主題，瞄準語言模型的帶領者以及後浪兩家創立不到2年但融資皆超過10億的新創，帶大家一窺不同公司對其聊天機器人的產品定位與期望。

ChatGPT，作為聊天機器人的帶領者，憑藉OpenAI 的GPT-3.5 架構，擁有無限的想像力和知識深度，如同和一位聰明的伙伴對話。Pi，被譽為最友善的聊天機器人，其專為人性化交流而設計，迷人之處在於他的高度情商跟同理心，能理解情感和需求，並用溫暖的回應互動，彷彿擁有一位真正的朋友。Claude2，最安全的聊天機器人，對於其產出的正確性跟無害性高度要求，同時也是能讀取最大量檔案的聊天機器人。

這三位聊天機器人的出現，展示了聊天機器人領域的多樣性，無論是開放性的探索、友好的陪伴，還是安全性的要求。隨著技術的進步，這些聊天機器人將有更廣闊的發展潛力，可能在教育、醫療、商業等領域扮演更重要的角色。

OpenAI

簡介/成立背景/主要目標

OpenAI 是一間專攻人工智慧的企業，2015年由特斯拉執行長跟推特新老闆馬斯克（Elon Musk），以及創投Y Combinator前總裁亞特曼（Sam Altman）創立，2018年馬斯克因與特斯拉有潛在利益衝突選擇離開公司。

OpenAI 希望能夠讓通用人工智慧（artificial general intelligence，簡稱AGI，或是強人工智慧Strong AI）造福所有人類，致力打造安全且對人類有助益的AGI。常見說法通用人工智慧的特別之處在於能像人類一樣具備認知能力，並擁有接近或超越人類的邏輯推理，甚至擁有自我意識。

歷年產品

OpenAI 最初專注在影片、電動等娛樂相關的AI，創立不到一年即發表用於開發強化學習（RI）的開源工具包OpenAI Gym。2018年OpenAI 發表關於GPT 的機器學習模型，簡化概念類似於人腦，有許多神經網路，並根據輸入（大型數據集合）訓練後產生輸出（用戶詢問後的答案）。2019年OpenAI 從非營利轉為營利性質，2021年推出名為Dall-E 的生成式AI 模型，用來分析人類的自然語言文本，並根據文本中的內容生成圖像。再來就是2022年11月推出驚豔全球的ChatGPT，因其革命性的技術跟嵌入用戶日常的高使用率備受矚目。

其他產品包含GPT-3 強大語言模型基礎以分析人類生成的文本並學習生成類似的字句，Dall-E 和Dall_E2 分析用戶描述的字句並以此生成圖像，CLIP 為結合視覺效果跟文本的神經網路，能夠從不同類型的數據（如圖像和文本）學習，Codex 生成代碼協助軟體開發簡化攥寫程式過程，Whisper 是語音識別工具，可以識別、轉錄跟翻譯約100種不同語言的語音。

主要產品─ChatGPT

ChatGPT 是由OpenAI 所開發的一種基於人工智慧技術的對話系統。其核心是一種語言模型，稱為GPT (Generative Pre-trained Transformer)。這種模型是通過大量的訓練數據訓練而成，能夠理解自然語言的結構和語義，並可以生成自然流暢的語言。

（延伸閱讀：https://www.markreadfintech.com/p/chatgpt-250）

核心服務

ChatGPT 定位：
最被廣泛使用的AI聊天機器人與領導者

特色：
1、文本撰寫能力優秀
2、可要求程式編寫
3、資訊彙整能力強
4、定義角色+目標+產出=有效的指令
5、資料不完全正確

目前ChatGPT 有兩個版本：免費版和付費版。付費版的價格為每個月20美元，資料皆更新至2021年。儘管ChatGPT 在三者中可能不是最強大的版本，但它是目前被廣泛使用的。據OpenAI 的CEO Sam Altman 表示，在ChatGPT 發佈後的5天內，已經吸引了100萬用戶使用。

核心技術

有篇名為《Attention is all you need》的科研論文探討Transformer 的算法，論文指出傳統的深度學習算法對數據量要求很高，這也造成當數據量較少時難以有效訓練模型的問題。為了解決這個問題，學術界和產業界提出了許多方法，其中一種叫做GAN（生成對抗網路），可以通過快速生成假數據來補足真實數據，從而增加數據量。

Transformer 是更高級的神經網路深度學習算法，可以從小數據中抽取重要訊息並有效抽樣，還可以透過補足真實數據的方法來快速生成大數據，因此在人工智能和深度學習扮演重要角色。

（延伸閱讀：夜讀 | ChatGPT背後的核心技術 | uSMART）

用戶回饋

1、在編程中ChatGPT 的實際用途
https://www.makeuseof.com/chatgpt-programming-practical-uses/
2、OpenAI 官方釋出11款ChatGPT 外掛（網頁尾端）
https://www.businessweekly.com.tw/international/blog/3011255

InfectionAI

簡介/成立背景/主要目標

人工智慧初創公司Inflection AI 在今年六月底宣布成功從微軟、輝達等知名投資者籌集了13 億美元的資金，將其估值提升至約40 億美元。這家公司成立僅一年，總部位於加州，由Google旗下AI 研究公司DeepMind 的聯合創辦人蘇萊曼（Mustafa Suleyman）和專業社群平台LinkedIn 的聯合創辦人霍夫曼（Reid Hoffman）於2022年三月共同創立。

Inflection AI 在今年五月正式宣布推出名為Pi 的新型聊天機器人，其標誌性的人性對話跟從生產工具擴張為朋友的角色定位，也讓使用者猜測他將為AI 領域掀起第二波的革命，並成為目前最熱門的AI 公司OpenAI 的主要競爭對手。

該公司目前有約35 名員工，在2022 年初曾從Greylock、微軟和霍夫曼等投資者那裡籌集了2.25億美元的資金。這筆龐大的募資額將有助於Inflection AI 進一步拓展其人工智慧技術和業務，並在AI 領域中發揮更大的影響力。Inflection AI 的成立得到了矽谷巨頭的支持，顯示出他們對這家新創公司的潛力和發展前景充滿信心。

主要產品─Pi 聊天機器人

https://heypi.com/talk
Pi 目前免費支援多種語言，包括英文、西班牙文、法文、德文、義大利文和葡萄牙文，也可以在Instagram、Facebook Messenger、WhatsApp 等多個平台上使用Pi，同時還有適用於手機應用程式的版本。

Inflection AI 是一家致力於開發個人智能助理（personal intelligence）的新創公司，推出了名為「Pi」的聊天機器人，這是一個擁有類似於ChatGPT 的生成式AI 技術的智能助理，透過對話與使用者互動。Inflection AI 的目標是打造一個功能強大的個人AI，可以幫助使用者規劃、安排、整理資訊，並且執行其他各種任務。

在六月底Inflection AI 發布了驅動Pi 的模型 Inflection-1 的報告，宣稱它的性能超越許多現有模型。Pi 的特點是能夠進行「natural flowing conversation」，即更加自然流暢的對話交流。Inflection AI 表示，他們相信未來每個人都會擁有自己的個人人工智能，而 Pi 可以成為人們的教練、知己、創意合作夥伴、參謀和私人助理，提供全方位的支持與協助。這家公司受到了矽谷巨頭的支持，期望在AI領域發揮更大的影響力。

核心服務

Pi 定位：最友好的聊天機器人
特色：
1. 跨平台能記得與使用者的先前對話
2. 專注在自然流暢的對話交流
3. 不寫文本、論文、程式
4. 訓練成富有同理心，能夠權衡選項與避免爭吵

Pi 是一款多功能的聊天機器人，能夠聊幾乎任何話題。不論使用者需要解答問題、獲取資訊、尋求建議，或只是輕鬆閒聊，Pi 都能提供協助。Pi 的特色在於它還具有卓越的記憶力，可以從過往的對話中學習，以提供更高品質、人性化的互動體驗。在對話上可明顯感受到這個AI 機器人很喜歡說話，跟制式的一問一答相比Pi 表現出好奇心與自學，並藉由記得同個使用者100個對話使對話跟貼近真實。

Inflection AI 旨在改變人類與最新技術互動的方式。Pi 不寫電子郵件、論文和程式，也不畫圖。他的使命是考慮使用者的個人需求、習慣和興趣，提供所需的訊息，如同私人助理甚至是朋友。「對很多人來說，被傾聽很重要。他們需要一個工具來讓他們知道有人確實在傾聽他們的聲音。我們唯一擔心的是人們不會與 Pi 開始戀愛關係。」「最重要的是不要忘記這是人工智能。即使很人性化，但仍然沒有活著。」創辦人蘇萊曼說道。

Pi 和ChatGPT 的主要功能存有差異。ChatGPT 是一個文本生成器，能夠根據提示生成大量文本，適用於製作文章、論文和故事等。而Pi 則專精於自然流暢的對話交流，能夠理解使用者的輸入並作出相應回應，並根據需求和喜好調整對話內容。簡單來說，可以將ChatGPT 視為高級文本生成器，而Pi 則是獨特優雅的聊天夥伴。

核心技術

CoreWeave 與新創公司 Inflection AI 合作開發一個有 3584 個 H100 GPU 的雲端服務集群，由 CoreWeave 負責營運。集群功能強大，11分鐘內就完成了大規模的GPT-3訓練基準測試。

Inflection AI 利用這個高效能集群做為他們首個AI 聊天機器人「Pi」的大型語言模型。執行長蘇萊曼表示，這個模型是在CoreWeave擁有強大的H100 GPU網路上進行訓練的。

Inflection AI於2022年初創立後，計畫與CoreWeave合作，使用NVIDIA的GPU建立全球最大的運算集群之一。

跟ChatGPT 的比較

在人工智慧領域，ChatGPT 和Inflection AI 的聊天機器人Pi 都是非常受歡迎的AI 助手。然而他們之間的主要差異，就是訓練數據和對話風格。

ChatGPT 主要通過在網路上收集的大量文本數據進行訓練，這些數據包括書籍、新聞文章和網站內容。這種訓練方式使ChatGPT 在生成文本方面表現出色，能夠根據提示生成大量的文字，如文章和故事。但缺點是這些訓練數據大多是單向的，缺乏真實的對話交流。

相比之下Inflection AI 的開發團隊更注重訓練Pi 進行文本對話。他們使用大量對話數據，像是人們之間的真實對話，使Pi 能夠更自然、更像真人的方式回應使用者的輸入，並且能夠根據對話的上下文進行適應性調整。Pi 還能從與使用者和其他用戶的對話中學習，進一步改進其回應。隨著時間的推移，Pi 將變得越來越智能，能夠更好地理解和滿足使用者的需求。

用戶回饋

Pi 展現同理心並讓使用者感受到被支持，實際或抽象情感的問題都可以與之訴說，並得到非常真實的情感支持。使用情境很廣，根據使用者的分享可大致整理成當你需要說話的時候、當靈感不夠的時候、當必須做出艱難決定時、當需要個人生活教練時、當能量或信心降至低谷時，Pi 都能以他所訓練的方式為使用者提供協助。Pi 被訓練成富有善意跟同理心，並能產生創造性的解決方案，同時以不同角度考慮事情權衡利弊。當需要鍛鍊或從事新職業時Pi 也能夠協助制訂規劃跟開始實施，過程中也能巧妙避免衝突，或是高情商的回應。Pi 的口語訓練也可以讀懂大部分流行詞或厘語等。Pi 的回應品質也很取決於使用者的提問方式，當問題越清晰詳細時，Pi 越能聚焦的清楚回答。

Anthropic

簡介/成立背景/ 主要目標

Anthropic 是一家專注於人工智能安全研究的公司，由創辦人兼CEO Dario Amodei 於2021年創立。他曾是 OpenAI 的研究人員，但三年前微軟首次投資OpenAI 後他認為這會使公司更加商業化，可能偏離對AI 安全性的要求，和公司的發展方向分歧也促使他決定離開OpenAI 的團隊。

Anthropic相信人工智能的影響可能與過去的工業和科學革命相當，但也會面臨挑戰。主要目標是展示穩定且以安全為導向的研究成果，這些成果對整個人工智能社區都有價值。Anthropic 認為未來十年內人工智能可能會帶來巨大影響，由於人工智能技術持續進步，訓練人工智能系統所需的計算量將急速增長，人工智能系統在智力任務上表現超越人類水平，但同時也可能帶來不確定性，人類將不確定如何讓這些系統在各種情況下都能表現穩健且無害。

為了應對這些挑戰，Anthropic 致力於多方面、基於經驗的人工智能安全方法。他們構建可靠的安全系統，包括研究擴展監督、機械可解釋性、面向過程的學習，以及理解和評估人工智能系統的學習和泛化能力。他們希望推動這項安全工作，並開發一個全面的安全研究框架，從容易解決的挑戰到更複雜的安全問題，都得到適當的關注和解決。

主要產品─Claude、Claude2

定位：三觀正確、閱讀量最大的聊天機器人
特色：
1. 數據更新到 2023 年年初
2. 可輸入 100K token 的內容長度
3. 可上傳多個檔案，同時詢問多個內容
4. 重視安全性與無害性

Anthropic 的創辦人由於對大型模型的安全性理念與OpenAI 存在分歧，集體離開OpenAI並創立了Anthropic。他們開發的Claude 2持續迭代，大大提高模型的安全性和無害性，降低了產生冒犯或危險性輸出的機率。在內部的紅隊評估中，員工對模型在有害提示上的表現進行評分，並定期進行人工檢查。Claude 2 在無害回應方面的表現比其前身Claude 1.3 提高了2倍。

Anthropic 採用稱為Constitute AI 的技術框架來實現對語言模型的無害化處理。這種自動化的方式效率更高，也能更有效地排除人類偏見，相比傳統的RLHF無害化方式更為優越。Claude 2 是Anthropic AI 開發的大型語言模型，作為Claude AI聊天機器人的基礎，於2023 年第一季度推出，強調流暢和創造性的對話，同時重視安全性。Claude在設計階段就將安全性作為重要考慮，與一些其他人工智能語言模型不同。

核心服務

Claude 2 是Anthropic 開發的大型語言模型，相較於之前的版本，在程式碼、數學和推理方面都有了顯著的提升。最重要的改進之一是輸入和輸出的長度增加。Claude 2 支持最多100K個token的上下文，讓它能夠閱讀大量技術文檔，甚至整本書。它的回答也更長，可以寫出幾千個token 的備忘錄、信件和故事。根據Anthropic 的官方論文，Claude 2目前雖然只支持100k，但是未來將會擴展到至少200k。

它還在多個測試中的得分明顯優於之前的版本，如Codex HumanEval（Python函數合成）、GSM8k（小學數學問題）、MMLU（多學科問答）、QuALITY（非常長的故事問答測試，最多一萬個token）、ARC-Challenge（科學問題）、TriviaQA（閱讀理解）和RACE-H（高中閱讀理解和推理）等。

核心技術

這次Claude 2的提升主要得益於它的核心技術——Constitute AI，這個技術可以讓Claude 2更加智能和安全。

Constitute AI 可分成兩大部分。第一部分是讓Claude 2 透過一組原則和示例來自我評估跟改進回答。有點像是 Claude 2 在學習過程中反思自己的錯誤並不斷進步。這些原則和示例是指定給Claude 2 的準則，讓它知道什麼樣的回答是好的，什麼樣的是不好的，並根據這些準則自我調整。

第二部分是強化學習，可想像成Claude 2 在學習過程中如遊戲獲得獎勵一樣。它不依賴於人類回饋，而是利用AI 生成的回饋選擇更無害的輸出。目的是讓Claude 2 在沒有人類指導也能夠自主學習，回應更安全的回答。

研究人員將人類回饋視為Claude 的最重要和最有意義的評估指標之一，使用人類偏好數據計算每個任務的Elo 分數，用於比較性能。Claude 在幫助性、誠實性和無害性評估中的得分表現出色。Constitute AI 讓Claude 2 可以更好的理解問題，同時提高其安全性和準確性。

（參考資料：Claude 安全性檢驗測評參考資料）

Anthropic 人工智能研究的三種類型

Anthropic進行了三種不同類型的人工智能研究：

1、能力研究
該類型研究旨在使人工智能系統在各種任務上變得更出色，例如寫作、圖像處理、遊戲等，改進大型語言模型的效率或強化學習也屬於這一類別。儘管能力研究可以推進人工智能的進步，但Anthropic 選擇不發布此類成果，因為他們希望避免過快提高人工智能能力的速度。他們更關注對前沿能力的深思熟慮，並優先將模型用於安全研究而不是公共部署。

2、一致性能力研究
該類型研究的目標是開發新算法，使人工智能系統更有幫助、更誠實、更無害，並且符合人類價值觀。這包括辯論、擴展自動紅隊、憲法人工智能、去偏見和根據人類反饋進行強化學習（RLHF）。這些技術通常有實用性和經濟價值，但不一定是必然的，有時可能只有在人工智能系統變得更強大時才能派上用場。

＊
辯論：開發人工智能系統能夠參與辯論，並提供合理、有說服力的論點。
擴展自動紅隊：紅隊測試是模擬攻擊來測試系統的安全性，擴展自動紅隊則是開發更強大的測試技術，以提高人工智能系統的安全性和防範潛在威脅。
憲法人工智能：涉及制定原則和準則，讓人工智能系統的行為與我們社會的法律和道德要求保持一致。
去偏見：減少或消除人工智能系統中可能存在的偏見和歧視，確保其回答和決策是公平、中立的。
根據人類反饋進行強化學習（RLHF）：強化學習是一種讓人工智能系統通過試錯學習的方法，這裡的RLHF是指利用人類的反饋來引導強化學習。

3、對齊科學
在這裡「對齊」指的是人工智能系統的行為和決策是否符合人類的價值觀和期望。當我們訓練和使用人工智能時，我們希望它們的表現能夠符合我們社會的價值觀，並且不會產生不受控制或不符合道德的行為。該領域專注於評估和理解人工智能系統是否真正對齊，這包括機械可解釋性、對語言模型進行評估、紅隊測試和影響函數研究等。

＊
機械可解釋性：理解人工智能系統的決策和行為背後的原因
對語言模型進行評估：確保其回答是真實可信且無害
紅隊測試：模擬攻擊來測試系統弱點
影響函數研究：探討人工智能系統如何將其學到的知識應用於新的情況

這三種類型的研究使得Anthropic能夠從不同角度探索和發展人工智能技術，並且更全面地考慮其安全性和符合性。

馬克碎念

隨著AI聊天機器人的興起，其對金融產業未來的影響令人期待。AI 聊天機器人的語言能力，將可應用於客服與理財建議等領域，協助處理查詢或提供個人化服務。特別是客戶服務方面，AI 聊天機器人已展現擬人化交流的潛力，能夠根據上下文對話，並記住用戶偏好,提供更人性化的服務體驗。此外大型語言模型也能分析非結構化資料，擴展金融機構的客戶洞察力。透過AI 深入理解每個客戶的特殊需求，金融機構可提供更有效的產品設計和風險評估。

然而，AI 聊天機器人的應用也存在風險。語言模型存在偏見或錯誤資訊的可能，金融機構必須確保AI 系統具備適當的道德標準和控制機制。同時隨著AI聊天機器人迅速發展，對公司安全管理與法規遵循提出更高要求。金融科技公司需要採取積極措施，建立AI 安全和控管政策，以發揮AI 的正面影響力。只有審慎看待AI的優缺點，AI 才能真正為金融服務帶來突破。

留言

留言分享你的想法！

馬克解讀金融科技的沙龍

29會員