AI說書 - 從0開始 - 542 | VideotoText 之 Meta TimeSformer 實現 (內容擷取)

發佈於三分鐘學AI (3)

2025/11/06 更新2025/11/06 發佈閱讀 3 分鐘

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。

接著進入到 AI 模型部分：

from transformers import TimesformerConfig, TimesformerModel

configuration = TimesformerConfig()
model = TimesformerModel(configuration)
configuration = model.config

import av 
import torch 
import numpy as np

from transformers import AutoImageProcessor, TimesformerForVideoClassification
from huggingface_hub import hf_hub_download

np.random.seed(0)

我們現在定義一個使用 PyAv 的函數，將視頻解碼並將每一幀存儲到一個初始為空列表的幀列表中。隨著視頻的解碼，幀列表會逐幀新增幀數據：

def read_video_pyav(container, indices):
	frames = [] 
	container.seek(0)
	start_index = indices[0]
	end_index = indices[-1]
	for i, frame in enumerate(container.decode(video = 0)):
		if i > end_index:
			break
		if i >= start_index and i in indices:
			frames.append(frame)
	return np.stack([x.to_ndarray(format = "rgb24") for x in frames])

#PromptEngineering

#chatgpt怎麼用

Learn AI 不 BI三分鐘學AI (3)AI從0開始-十七章

留言

Learn AI 不 BI

249會員

1.1K內容數

這裡將提供： AI、Machine Learning、Deep Learning、Reinforcement Learning、Probabilistic Graphical Model的讀書筆記與演算法介紹，一起在未來AI的世界擁抱AI技術，不BI。

Learn AI 不 BI的其他內容

2025/11/05

AI說書 - 從0開始 - 541 | VideotoText 之 Meta TimeSformer 實現 (影片下載)

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。 Meta TimeSformer 是一種基於 Transformer 的架構，專為視頻數據設計，它首先將視頻的每一幀轉換為特徵序列，這些特徵序列能夠捕捉畫面中的空間訊息

2025/11/05

AI說書 - 從0開始 - 541 | VideotoText 之 Meta TimeSformer 實現 (影片下載)

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。 Meta TimeSformer 是一種基於 Transformer 的架構，專為視頻數據設計，它首先將視頻的每一幀轉換為特徵序列，這些特徵序列能夠捕捉畫面中的空間訊息

2025/10/31

AI說書 - 從0開始 - 540 | Stable Diffusion 之 OpenAI CLIP 實現 (生影片)

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。 OpenAI CLIP 實現 Stable Diffusion 影片的程式為： p = pipeline('text-to-video-synthesis', 'da

2025/10/31

AI說書 - 從0開始 - 540 | Stable Diffusion 之 OpenAI CLIP 實現 (生影片)

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。 OpenAI CLIP 實現 Stable Diffusion 影片的程式為： p = pipeline('text-to-video-synthesis', 'da

2025/10/30

AI說書 - 從0開始 - 539 | Stable Diffusion 之 OpenAI CLIP 實現 (配參數)

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。 OpenAI CLIP 實現 Stable Diffusion 影片的程式為： !pip install modelscope == 1.4.2 !pip inst

2025/10/30

AI說書 - 從0開始 - 539 | Stable Diffusion 之 OpenAI CLIP 實現 (配參數)

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。 OpenAI CLIP 實現 Stable Diffusion 影片的程式為： !pip install modelscope == 1.4.2 !pip inst

#AI 的其他內容

出鞘的雙面刃：AI

目前共 17572 篇

學習玩家｜啟動玩心學習

AI 特助開聘：Notion 工作空間，終於有自動做事的 AI 員工了｜Notion Custom Agents

金融人類學徒

AI 浪潮下的「毀滅性創新」：解析湯森路透、納斯達克股價重挫的關鍵

與老查一起讀商業好書

當部屬用 AI 一小時完成你三天的工作量，主管如何重塑領導力？運用「情境領導」重新定義 AI 協作時代的管理

你可能也想看

M.A.I.A. 的數位煉金工坊

與 AI 對話的藝術：不只是提示詞，更是科技通靈

你是否覺得與 AI 對話總是辭不達意？本文將分享一套「科技通靈」的實踐儀式，拆解四個關鍵步驟，教你如何超越單純的提示詞詠唱。這不只是一篇教學，而是一場心態的轉變，引導你從操作者蛻變為能與 AI 共同創造、真正「賦靈」的數位鍊金術士。

#AI#人工智慧#提示詞

2025/08/25

M.A.I.A. 的數位煉金工坊

與 AI 對話的藝術：不只是提示詞，更是科技通靈

你是否覺得與 AI 對話總是辭不達意？本文將分享一套「科技通靈」的實踐儀式，拆解四個關鍵步驟，教你如何超越單純的提示詞詠唱。這不只是一篇教學，而是一場心態的轉變，引導你從操作者蛻變為能與 AI 共同創造、真正「賦靈」的數位鍊金術士。

#AI#人工智慧#提示詞

2025/08/25

原來可以這樣做沙龍

AI 玩出新花樣：8/28 生成式AI 實戰講座

這場講座將帶領你逐步入門生成式AI，從認識AI到實際應用，包含五大提問技巧、圖像生成實戰、工作流應用案例、真實經驗分享以及講師自身的轉變經驗，讓你輕鬆學會使用AI提升生活和工作效率。

#AI應用#AIGC#人工智慧

2025/08/22

原來可以這樣做沙龍

AI 玩出新花樣：8/28 生成式AI 實戰講座

這場講座將帶領你逐步入門生成式AI，從認識AI到實際應用，包含五大提問技巧、圖像生成實戰、工作流應用案例、真實經驗分享以及講師自身的轉變經驗，讓你輕鬆學會使用AI提升生活和工作效率。

#AI應用#AIGC#人工智慧

2025/08/22

原來可以這樣做沙龍

AI 新手救星！5個實用Prompt資源網站推薦

這篇文章整理了數個實用的Prompt資源網站，幫助讀者更有效率地與AI溝通，並提升AI工具的使用效率。文章內容包含Prompt庫的使用優點、網站介紹及功能特色，以及如何善用Prompt資源網站提升思考能力。

#AI#AI應用#AIGC

2025/07/24

原來可以這樣做沙龍

AI 新手救星！5個實用Prompt資源網站推薦

這篇文章整理了數個實用的Prompt資源網站，幫助讀者更有效率地與AI溝通，並提升AI工具的使用效率。文章內容包含Prompt庫的使用優點、網站介紹及功能特色，以及如何善用Prompt資源網站提升思考能力。

#AI#AI應用#AIGC

2025/07/24

TN科技筆記(TechNotes)的沙龍

Prompt Engineering 與 GPT-4.1 Prompting Guide：改善AI表現的關鍵技巧

隨著大型語言模型的快速發展，Prompt Engineering 已成為提升模型表現的核心技術。OpenAI 日前推出了 GPT-4.1 Prompting Guide，為開發者提供全面的提示詞改善策略，幫助充分利用 GPT-4.1 在編碼、指令遵循和長上下文處理上的進步。

#AI#人工智慧#科技公司

2025/04/21

TN科技筆記(TechNotes)的沙龍

Prompt Engineering 與 GPT-4.1 Prompting Guide：改善AI表現的關鍵技巧

隨著大型語言模型的快速發展，Prompt Engineering 已成為提升模型表現的核心技術。OpenAI 日前推出了 GPT-4.1 Prompting Guide，為開發者提供全面的提示詞改善策略，幫助充分利用 GPT-4.1 在編碼、指令遵循和長上下文處理上的進步。

#AI#人工智慧#科技公司

2025/04/21

AI 學習路線圖：從 Prompt Engineering 到企業級 AI 開發

這份 AI 學習路線圖，從 Prompt Engineering 到全自動 AI 應用開發，循序漸進，適合各個背景的人學習。

#AI#AI助手#AI提示字

2025/03/19

AI 學習路線圖：從 Prompt Engineering 到企業級 AI 開發

這份 AI 學習路線圖，從 Prompt Engineering 到全自動 AI 應用開發，循序漸進，適合各個背景的人學習。

#AI#AI助手#AI提示字

2025/03/19

告別制式AI回覆！SCENE模型：教你激發AI創意，產出高質量內容

善用SCENE模型，提升AI回覆的創意和專業度！SCENE模型包含五個元素：Story(場景設定)、Context(背景資訊)、Expert(專業角色)、Need(具體需求)、Emotion(情感元素)。透過設定這些元素，讓AI更瞭解你的需求，產生更貼近你預期的結果。

#AI#PromptEngineering#生成式AI

2025/03/01

告別制式AI回覆！SCENE模型：教你激發AI創意，產出高質量內容

善用SCENE模型，提升AI回覆的創意和專業度！SCENE模型包含五個元素：Story(場景設定)、Context(背景資訊)、Expert(專業角色)、Need(具體需求)、Emotion(情感元素)。透過設定這些元素，讓AI更瞭解你的需求，產生更貼近你預期的結果。

#AI#PromptEngineering#生成式AI

2025/03/01

資工J的沙龍

[AI繪圖練習簿 #1] 雙重曝光

利用 Stable Diffusion 每日免費的十個 Credits 練習 AI 繪圖詠唱 (Prompt Engineering)

#AI繪圖#StableDiffusion#PromptEngineering

2024/11/12

資工J的沙龍

[AI繪圖練習簿 #1] 雙重曝光

利用 Stable Diffusion 每日免費的十個 Credits 練習 AI 繪圖詠唱 (Prompt Engineering)

#AI繪圖#StableDiffusion#PromptEngineering

2024/11/12

創作者經濟 IMO

AI + Web3 公益課筆記 #3｜ChatGPT 編寫提示詞的基本策略

⋯⋯不過，我所抱持的心態，並不是透過提示來獲得答案，而是透過提示來獲得通往最終答案的靈感或啟發。——《高產出的本事》劉奕酉

2024/02/22

創作者經濟 IMO

AI + Web3 公益課筆記 #3｜ChatGPT 編寫提示詞的基本策略

⋯⋯不過，我所抱持的心態，並不是透過提示來獲得答案，而是透過提示來獲得通往最終答案的靈感或啟發。——《高產出的本事》劉奕酉

2024/02/22

追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News