多模態人工智慧應用
含有「多模態人工智慧應用」共 37 篇內容
全部內容
發佈日期由新至舊
郝信華 iPAS AI應用規劃師 學習筆記
2025/08/29
Disentanglement(解耦表示學習)
Disentanglement(解耦表示學習)是在機器學習領域中,指學習一種資料表示,使得資料中的不同變異因素能被分離成彼此獨立且有意義的不同元素。 簡單來說,Disentanglement目標是將複雜高維資料如影像、語言等,拆解成多個獨立的解釋性組成部分,例如在影像中分離出物體的顏色、形狀、位置
含 AI 應用內容
#
多模態人工智慧應用
#
學習
#
獨立
1
留言
郝信華 iPAS AI應用規劃師 學習筆記
2025/08/21
Single Stream
Single Stream 神經網絡架構指的是利用單一數據流(stream)對輸入數據進行特徵提取和處理的神經網絡結構。與多流(multi-stream)或雙流(two-stream)網絡相比,單流網絡不會分開處理數據的不同模態或不同特徵子集,而是通過統一的網絡結構完成所有信息的學習。 Singl
含 AI 應用內容
#
多模態人工智慧應用
#
數據
#
神經
喜歡
留言
郝信華 iPAS AI應用規劃師 學習筆記
2025/08/21
Multi Stream
Multi Stream 神經網絡架構是指同時利用多條信息流(streams)對輸入數據的不同特徵或子空間進行獨立處理,然後再將這些多路特徵融合起來,以提升模型的表達能力和任務性能。 Multi Stream 神經網絡的主要特點: • 多條分支並行處理:每條流(stream)可以專注於數據的某
含 AI 應用內容
#
多模態人工智慧應用
#
數據
#
神經
喜歡
留言
郝信華 iPAS AI應用規劃師 學習筆記
2025/08/21
Two Stream
Two Stream 預設指的是一種神經網絡架構,通常在視頻分析、動作識別和人臉識別等領域中廣泛應用。其核心思想是將輸入的信息分成兩條流(stream)獨立處理,然後融合它們的特徵以獲得更全面的理解。 Two Stream 神經網絡架構主要特點: • 空間流(Spatial Stream):處
含 AI 應用內容
#
多模態人工智慧應用
#
視頻
#
神經
喜歡
留言
郝信華 iPAS AI應用規劃師 學習筆記
2025/08/21
Representation Learning(表徵學習)
Representation Learning(表徵學習)是機器學習中的一種技術,目標是自動學習和提取原始數據的有效特徵(表示),使得後續的機器學習任務如分類、回歸、更高層次的推理等能更好地進行。它擺脫了傳統手工特徵設計的限制,讓模型能通過數據自主發掘有用的表示。 核心理念: • 自動從原始數
含 AI 應用內容
#
多模態人工智慧應用
#
學習
#
機器學習
喜歡
留言
郝信華 iPAS AI應用規劃師 學習筆記
2025/08/21
Driver Monitoring System(駕駛員監控系統,簡稱 DMS)
Driver Monitoring System(駕駛員監控系統,簡稱 DMS)是一種車輛安全技術,用於實時監控駕駛員的行為和生理狀態,以識別疲勞、分心或其他注意力不集中情況,並及時發出警告或介入,從而提高行車安全。 主要功能: • 監測駕駛員的眼動、視線方向、眨眼頻率和頭部位置,判斷疲勞或分
含 AI 應用內容
#
多模態人工智慧應用
#
駕駛
#
監控
喜歡
留言
郝信華 iPAS AI應用規劃師 學習筆記
2025/08/21
Fréchet Inception Distance(FID)
Fréchet Inception Distance(FID)是一種用於評估生成模型(特別是生成對抗網絡GAN)生成圖像質量和多樣性的指標。它通過比較生成圖像和真實圖像在深度特徵空間(通常使用Inception v3模型的中間層激活)中的分佈差異,衡量兩者之間的相似度。 FID 的特點與優勢:
含 AI 應用內容
#
多模態人工智慧應用
#
生成
#
模型
喜歡
留言
郝信華 iPAS AI應用規劃師 學習筆記
2025/08/21
Inception Score(IS)
Inception Score(IS)是一種用於評估生成式模型(特別是生成對抗網絡GAN)生成圖像質量和多樣性的指標。它利用一個預訓練的Inception v3圖像分類模型,對生成的圖像進行分類,評估圖像是否清晰且內容多樣。 Inception Score 的評估原理: 1. 圖像質量:對單張
含 AI 應用內容
#
多模態人工智慧應用
#
生成
#
模型
喜歡
留言
郝信華 iPAS AI應用規劃師 學習筆記
2025/08/21
Disentangled Representation Learning(解耦表示學習)
Disentangled Representation Learning(解耦表示學習)是機器學習領域的一種表示學習方法,其目標是將數據中的潛在生成因子分離成彼此獨立且具備語義解釋性的子表示。換言之,它試圖把複雜、高維的數據表示,拆解成多個獨立並且意義明確的因子,便於模型理解與操作。 解耦表示學習
含 AI 應用內容
#
多模態人工智慧應用
#
學習
#
數據
喜歡
留言
郝信華 iPAS AI應用規劃師 學習筆記
2025/08/21
Unimodal
Unimodal 指的是系統或模型僅使用單一類型的數據模態來進行處理和分析。例如,只使用文字、只使用圖像,或只使用音頻等單一模態。 Unimodal 的特點: • 單一數據來源:系統只處理一種類型的輸入數據,如僅圖像或僅文字。 • 結構相對簡單:由於處理單一模態,模型架構和訓練相對簡單。
含 AI 應用內容
#
多模態人工智慧應用
#
數據
#
模型
喜歡
留言