多模態

含有「多模態」共 9 篇內容

全部內容

發佈日期由新至舊

2025/11/22

Gemini 3 Pro全面刷新前沿基準：Google新王者登基，全面超越GPT-5.1與Claude Sonnet 4

Google於2025年11月發布Gemini 3 Pro，以壓倒性優勢全面擊敗GPT-5.1與Claude Sonnet 4.5，正式重奪AI性能王座。該模型在數學(AIME 2025滿分)、長文本推理及代理任務上展現世代飛躍，樹立了全新的SOTA (State-of-the-Art)標竿。

#Gemini3Pro #GoogleDeedMind #GPT51

Shaou-Gang Miaou

發文者

1 天前

謝謝閱讀本文章的讀者，希望讀完後都能有一點收穫!

Patrick.Wong的沙龍

2025/11/08

幾種常見的AI應用類型

幾種常見的AI應用類型： 1. 文字AI應用； 2. 圖像AI應用； 3. 音訊／語音AI應用； 4. 影像AI應用； 5. 複雜格式AI應用； 6. 總結：隨著AI應用蓬勃發展，多模態終將成為日常風景。

#AI #人工智慧 #AI應用

臺科雙語酷酷集團

2025/11/06

科技輔助下的 EMI 課程教材設計與課堂互動設計

多數 EMI 課堂面臨的真正難題是：「學生不是聽不懂英文，而是跟不上課程的節奏。」Z 世代學生習慣多媒體、短影音與即時回饋的學習模式，但傳統課堂仍以線性、單向講授為主.......

#雙語政策 #互動 #bilingual2030

Josh的沙龍

2025/11/03

一次掌握CLIP：AI跨模態理解的關鍵技術

CLIP是OpenAI推出的跨模態模型，透過同時理解文字與圖片，實現零樣本圖像分類、語意搜尋與智能生成等多種應用。本文將深入解析CLIP原理、訓練方式及優勢，讓你快速掌握前沿AI技術。

#AI #多模態 #CLIP

光淺JY的沙龍

2025/05/02

你以為AI會「聽」？別再誤會了！AI聽你說話其實是這樣運作的

音檔並非直接被大語言模型處理，而是先被轉換成文字，再被轉換成模型可理解的Token。本文探討音檔大小與Token數的關係，說明音檔容量與Token數並非直接相關，影響Token數的是轉換後的文字數量。

#生成式AI #AI #AI工具

冒冒

2025/05/03

果然是工程師的背景？ＸＤ

光淺JY

發文者

2025/05/12

冒冒我不是工程師出身的，感謝我們家工程師很努力的幫助我成長🤣🤣🤣

AI 峰哥

2024/12/17

ChatGPT帶你玩轉AI，最新多模態技術的無限可能

這篇文章探討了AI多模態技術的革命性進展，包括視覺分析、語音合成與情緒理解等能力，如何從看圖識字到生成程式碼，全面提升工作效率與生活便利。文中以實際案例和企業應用展示多模態技術的潛力，並強調它對個人與商業世界的深遠影響，展現AI的無限可能。

#阿峰老師 #AI #人工智慧

方格子 vocus 官方沙龍

2024/05/17

OpenAI「PT-4o來了」一起來Omni、Omni！🤗

#OpenAI #ChatGpt #GPT4o

方格子 vocus

2024/05/20

a N 嗨，謝謝你的分享，格編也提醒，vocus 討論區還是以和 vocus 相關的交流為主（例如：你創作了什麼內容、分享你感興趣的話題等等），讓所有的格友都可以一起交流唷！發文前歡迎參考《互動指南》：https://vocus.cc/post/659e7b58fd897800019bfd84 謝謝！