AI Booster - Things we learned about LLMs in 2024

更新於 發佈於 閱讀時間約 5 分鐘


raw-image


有興趣回顧 LLM 在2024的一些大事記可以參考這篇文章

▌GPT-4 barrier GPT-4 的障礙被全面突破。2023 年底時還沒有其他實驗室能夠開發出超越 OpenAI 的 GPT-4 模型。但在 2024 年至少有 18 個開發出在 Chatbot Arena 排行榜上得分高於 GPT-4 的模型 (Google, OpenAI, Anthropic, Alibaba, Meta, and others)。

▌More accessible 過去認為需要數據中心級伺服器才能運行的 GPT-4 等級模型,現在可以在一般的個人電腦上運行,這歸功於模型效率的顯著提升,Qwen2.5-Coder-32B 和Meta’s Llama 3.3 70B可以順利在邊緣裝置上運行。

▌LLM prices crashed 由於競爭加劇和效率提升,託管 LLM 的成本大幅降低。例如,OpenAI 的 GPT-4o 比 GPT-4 便宜 12 倍,而 Google 的 Gemini 1.5 Flash 8B 甚至比去年的 GPT-3.5 Turbo 便宜 27 倍。這種價格下降使得 LLM 更容易被廣泛使用,也降低了能源成本。

▌Multimodal 多模態視覺應用普及,音訊和影片應用開始出現。2024 年,幾乎所有主要的模型供應商都發布了多模態模型,例如 Anthropic 的 Claude 3 系列、Google 的 Gemini 1.5 Pro 和 Meta 的 Llama 3.2 。這些模型可以處理圖像、音訊和影片等多種輸入形式。

▌Voice and live camera modes 語音和即時攝影機模式也開始出現,使 LLM 的應用更加豐富。GPT-4o 的語音模式可以接受音訊輸入並輸出逼真的語音,而無需單獨的 TTS 或 STT 模型。即時攝影機模式也已推出,允許模型即時分析攝影機畫面。

▌Prompt-driven app generation LLM 現在能夠根據提示生成完整的互動式應用程式。Anthropic 的 Claude Artifacts 功能允許使用者在 Claude 介面內直接使用這些生成的應用程式。

▌Inference -scaling models 以 OpenAI 的 o1 模型為代表的新型 LLM 模型,通過在推理過程中花費更多計算資源來提升性能。這種方法為模型擴展開闢了新途徑,使其能夠應對更複雜的問題。

▌Synthetic training data AI 實驗室越來越多地使用合成數據來訓練模型,而不是僅依賴網路上的資料。

▌DeepSeek v3 DeepSeek v3 模型以約 560 萬美元的成本訓練出來,其效能與 Claude 3.5 Sonnet 相近,是否顯示出顯著的訓練成本優化?

▌”Agents “ have not yet materialized 「代理」一詞缺乏明確的定義,且其效用仍受到質疑 。LLM 的「輕信 (gullibility)」問題導致任何試圖代表使用者做出有意義決策的系統都存在可靠性問題。

▌Evals (evaluations) 評估(Evals)的重要性日益凸顯 。為 LLM 系統建立良好的自動化評估系統已成為開發可靠應用的關鍵技能 。有效的評估方法可以幫助更快地採用新模型,並建立更可靠的產品功能。

▌Slop 「Slop(廢料)」一詞的出現。 「Slop」成為描述未經請求和未經審查的 AI 生成內容的術語。這個詞彙的出現反映了社會對 AI 生成內容的擔憂。

▌The environmental impact 由於模型效率的提升,單個提示的能源消耗大幅下降。 然而,數據中心基礎設施的競爭性建設對環境造成了更大的影響,引發了人們對其長期可持續性的擔憂。




謝謝您花時間將此篇文章讀完,若覺得對您有幫助可以幫忙按個讚、分享來或是珍藏喔!也歡迎Follow我的Threads/ FB,持續追蹤生產力工具、商業分析、商業英文的實用範例,提升自己的職場力喔!


avatar-img
33會員
66內容數
我們秉持著從原人進化的精神,不斷追求智慧的累積和工具的運用來提升生產力。我們相信,每一個成員都擁有無限的潛力,透過學習和實踐,不斷成長和進步。
留言0
查看全部
avatar-img
發表第一個留言支持創作者!
DigNo Ape 數遊原人 的其他內容
出國念研究所之前,我有短暫1–2年外派深圳的工作經驗,當時我主管安排讓我做了3個月的「客戶接待」,負責處理從美國到來客戶的大小事包括安排交通、訂餐、門禁等,當時剛退伍的我僅是以為這些雜事本來就是菜鳥應該要做的,多年後細細品味這段時光才逐漸明白主管當時的深意,而從中領悟出的心態、培養出的習慣至今仍
外商面試 雜談「遠端職位」 即便back to office已經是許多美國公司主要的訴求,不時一些工作職位還是會有遠端(remote) 的機會/需求,申請者也相當踴躍,以下整理一些我自2020年以來面試遠距工作申請者的一些問題提供參考,之後也會分享一些我覺得回答相不錯的範例。
多年前與其他部門的同事一起面試應試者時,同事在快結束時突然拋出一個問題,「你都是如何管理你的Email?」。現在已經忘記當時的應試者的回答,但這個看似簡單且不具專業內涵問題,其實能充分看出一個人的工作態度、做事邏輯、職場素養。 以下是我的幾個方法👇 ▌郵件主題 (subject) / 善用指令
即便身在組織,請把公司的同事視為你的「客戶 」,他們是你營收來源的一部分。 遠端工作時須隨時保持在組織的「存在感 」,即便沒有任務,主動與主管與同事溝通,了解各項專案和事務的進度,不僅能讓你掌握最新動態,還能提升自己在組織中的能見度。 ...
Liaison 前陣子組織調整,高階主管指派某主管 will serve as the primary Sales liaison with Finance team,其中「Liaison」指的是「聯絡人」或「聯絡角色」,負責Sales部門與Finance部門之間的溝通和協調工作,確保兩個
Pan out That new strategy project didn’t “pan out”. 這句話的背景是我們與業務組合作一個策略案呈報至高層,過1–2周後我問主管專案的狀況,他回我這句,意思是進展沒有成功、不順利。這片語跟過去掏金潮的背景有關,使用掏金用的平底盤pan,篩出金子過程
出國念研究所之前,我有短暫1–2年外派深圳的工作經驗,當時我主管安排讓我做了3個月的「客戶接待」,負責處理從美國到來客戶的大小事包括安排交通、訂餐、門禁等,當時剛退伍的我僅是以為這些雜事本來就是菜鳥應該要做的,多年後細細品味這段時光才逐漸明白主管當時的深意,而從中領悟出的心態、培養出的習慣至今仍
外商面試 雜談「遠端職位」 即便back to office已經是許多美國公司主要的訴求,不時一些工作職位還是會有遠端(remote) 的機會/需求,申請者也相當踴躍,以下整理一些我自2020年以來面試遠距工作申請者的一些問題提供參考,之後也會分享一些我覺得回答相不錯的範例。
多年前與其他部門的同事一起面試應試者時,同事在快結束時突然拋出一個問題,「你都是如何管理你的Email?」。現在已經忘記當時的應試者的回答,但這個看似簡單且不具專業內涵問題,其實能充分看出一個人的工作態度、做事邏輯、職場素養。 以下是我的幾個方法👇 ▌郵件主題 (subject) / 善用指令
即便身在組織,請把公司的同事視為你的「客戶 」,他們是你營收來源的一部分。 遠端工作時須隨時保持在組織的「存在感 」,即便沒有任務,主動與主管與同事溝通,了解各項專案和事務的進度,不僅能讓你掌握最新動態,還能提升自己在組織中的能見度。 ...
Liaison 前陣子組織調整,高階主管指派某主管 will serve as the primary Sales liaison with Finance team,其中「Liaison」指的是「聯絡人」或「聯絡角色」,負責Sales部門與Finance部門之間的溝通和協調工作,確保兩個
Pan out That new strategy project didn’t “pan out”. 這句話的背景是我們與業務組合作一個策略案呈報至高層,過1–2周後我問主管專案的狀況,他回我這句,意思是進展沒有成功、不順利。這片語跟過去掏金潮的背景有關,使用掏金用的平底盤pan,篩出金子過程
你可能也想看
Google News 追蹤
Thumbnail
嘿,大家新年快樂~ 新年大家都在做什麼呢? 跨年夜的我趕工製作某個外包設計案,在工作告一段落時趕上倒數。 然後和兩個小孩過了一個忙亂的元旦。在深夜時刻,看到朋友傳來的解籤網站,興致勃勃熬夜體驗了一下,覺得非常好玩,或許有人玩過了,但還是想寫上來分享紀錄一下~
Thumbnail
OpenAI最近進行了重大更新,ChatGPT-4o將開放給所有用戶,具備更強的理解力和出色的長文、邏輯能力等功能。新版本增加了上傳圖片的選項,更換模型功能,並進行了功能測試。本文將針對用戶的實際體驗進行測評。
Thumbnail
OpenAI 春季發布會推出了 GPT-4o 模型,免費且響應速度更快,具備文字、音訊、影像的多模態輸入功能。
Thumbnail
2024年5月13日,Openai發布了新一代的模組GPT-4o,念法:GPT-four-O。強調即時對話以及圖像解析能力,官方發布的影片中展現了即席英語-義大利語口譯、程式碼解析、算式解析、人臉表情解析,以及幾乎可媲美真人的語音回應,包含調整語氣、用詞以及模仿機器人語音等,相當令人驚豔。
Thumbnail
史丹佛大學的AI指數2024報告(2024 AI Index Report)歸納了10大重點: 人工智慧(AI 在某些任務上擊敗了人類,但並非在所有任務上都擊敗了人類。AI在許多方面已經超越了人類基準,包括圖像分類、視覺推理和英語理解方面的一些基準。。。。
Thumbnail
OpenAI成立於2015年,旨在以非盈利方式促進AI發展,並避免潛在危害。從GPT-1到GPT-4的發展過程展現了AI無監督學習及多任務學習的潛力。這篇文章回顧了OpenAI在自然語言處理方面的歷程與技術演進,並介紹了各個模型樣本和能力的提升。
Thumbnail
前言 在AI經歷數個冰河期後,終於在後疫情時代來到了一個技術高峰,而這個破冰者就是OPen AI(ChatGPT),對於這個話題不管你是是正在接觸AI,對AI技術有些了解的人,抑或是專業領域上對於AI介入感到焦慮的人都希望可以文中得到收穫。 本文想分享一些個人對於AI的理解及對於LLM模型的一些
Thumbnail
嘿,大家新年快樂~ 新年大家都在做什麼呢? 跨年夜的我趕工製作某個外包設計案,在工作告一段落時趕上倒數。 然後和兩個小孩過了一個忙亂的元旦。在深夜時刻,看到朋友傳來的解籤網站,興致勃勃熬夜體驗了一下,覺得非常好玩,或許有人玩過了,但還是想寫上來分享紀錄一下~
Thumbnail
OpenAI最近進行了重大更新,ChatGPT-4o將開放給所有用戶,具備更強的理解力和出色的長文、邏輯能力等功能。新版本增加了上傳圖片的選項,更換模型功能,並進行了功能測試。本文將針對用戶的實際體驗進行測評。
Thumbnail
OpenAI 春季發布會推出了 GPT-4o 模型,免費且響應速度更快,具備文字、音訊、影像的多模態輸入功能。
Thumbnail
2024年5月13日,Openai發布了新一代的模組GPT-4o,念法:GPT-four-O。強調即時對話以及圖像解析能力,官方發布的影片中展現了即席英語-義大利語口譯、程式碼解析、算式解析、人臉表情解析,以及幾乎可媲美真人的語音回應,包含調整語氣、用詞以及模仿機器人語音等,相當令人驚豔。
Thumbnail
史丹佛大學的AI指數2024報告(2024 AI Index Report)歸納了10大重點: 人工智慧(AI 在某些任務上擊敗了人類,但並非在所有任務上都擊敗了人類。AI在許多方面已經超越了人類基準,包括圖像分類、視覺推理和英語理解方面的一些基準。。。。
Thumbnail
OpenAI成立於2015年,旨在以非盈利方式促進AI發展,並避免潛在危害。從GPT-1到GPT-4的發展過程展現了AI無監督學習及多任務學習的潛力。這篇文章回顧了OpenAI在自然語言處理方面的歷程與技術演進,並介紹了各個模型樣本和能力的提升。
Thumbnail
前言 在AI經歷數個冰河期後,終於在後疫情時代來到了一個技術高峰,而這個破冰者就是OPen AI(ChatGPT),對於這個話題不管你是是正在接觸AI,對AI技術有些了解的人,抑或是專業領域上對於AI介入感到焦慮的人都希望可以文中得到收穫。 本文想分享一些個人對於AI的理解及對於LLM模型的一些