深度學習

含有「深度學習」共 124 篇內容
全部內容
發佈日期由新至舊
  【龜兔賽局的故事】   在寫這篇”AI時代,駭客組織與企業資安斷點的龜兔賽局”的內容前,我一直在想要用怎麼樣的方式來寫會比較容易讓企業有感又容易看懂目前自身的處境與風險,剛好最近剛上小學一年級的兒子都會叫我”為愛朗讀”,我發現小恐龍、小妖怪之類或是寓言故事的情節總是較能讓他理解與感
Thumbnail
--- SO-VITS-SVC 是一款開源 AI 唱歌模型,作者分享了從零開始打造專屬 AI 歌姬的經驗。從初次接觸 AI 到克服技術門檻,作者驚艷於 AI 的真實歌聲表現,並探索 AI 在聲音生成、繪圖、寫作等領域的潛力。文章提到模型對硬體要求高,未來將分享數據準備與環境部署,幫助讀者輕鬆入門。
Thumbnail
本文探討了機器翻譯技術,特別是神經機器翻譯(NMT)的發展及其在商業與專業領域的應用。儘管技術提升,專家認為人力翻譯在高精度、文化適配等領域仍不可或缺,未來將呈現人機協作的新模式。
輝達(NVIDIA)成立於1993年,由黃仁勳(Jensen Huang)、Chris Malachowsky和Curtis Priem共同創辦,目前為市值超過3兆美元公司。作為一家專注於圖形處理單元(GPU)和人工智能(AI)技術的領導者,輝達已成為全球半導體行業的領先地位。
Thumbnail
李飛飛推出的大世界模型(LWM)是一項突破性的AI技術,目標提升AI的空間智能,能生成可互動的三維世界。該技術有望改變數位創作、遊戲、電影等領域的發展,並推動數位轉型。
直覺來說注意力機制是我們如何對圖像的不同區域進行視覺關注或如何關聯句子中的詞語。人類的視覺注意力允許我們以「高解析度」聚焦於特定區域(例如,看黃色框中的尖耳朵),同時以「低解析度」感知周圍的圖像(例如,現在雪地背景和服裝如何?),然後相應地調整焦點或進行推理。
Thumbnail
一個好的機器學習模型通常需要大量樣本進行訓練。相比之下,人類學習新概念和技能要快得多,也更有效率。例如:小孩子只需見過幾次貓和鳥就能很快分辨它們。會騎自行車的人很可能在很少甚至沒有示範的情況下就能發現騎摩托車的方法。這樣的生活經驗讓大家想到是否有可能設計一個具有類似特性的機器學習模型: 元學習
大型transformer模型已成為最近的主流,在處理各種不同的任務上都獲得了很好的結果。大型transformer功能強大,但在計算效能和記憶體方面都有極高的要求,這也造成使用transformer大規模解決真實世界任務時的一個大瓶頸。本文嘗試介紹一些最佳化方法來突破這些瓶頸。
前言 許多年前已經有許多研究使用影像處理方法來生成文字,如圖像描述和視覺問答。傳統上,這類系統依賴於物體檢測網絡作為視覺編碼器來捕捉視覺特徵,然後通過文字解碼器生成文字。鑑於大量現有文獻。這篇文章會專注於解決視覺任務的一種方法,即擴展預訓練的通用語言模型,使其能夠處理視覺信號。本文大致將這些視覺語
時光回溯至2018年,自然語言處理(Natural Language Processing, NLP)領域開始有了驚人的進展。像OpenAI GPT和BERT這樣的大規模預訓練語言模型在解決各種不同的任務上取得了優異的表現。