方格子 vocus

MediaPipe結合Grasshopper進行互動設計

2023/07/10 更新2023/07/09 發佈閱讀 17 分鐘

互動裝置

為了強化步行感知的創造與圍塑，對於環境本身的危險因素，可以透過街道設施的設計與檢驗，提高安全性。但針對若在環境安全的心理危險感知，該如何解決現存公共空間存在的潛在危險。危險感知通常來自心理層面的情緒知覺或認知，設計上該如何介入已被填滿的都市。根據筆者分析，這種具時間性、特定族群、情緒感知的街道改善建議，並非從實際環境的基礎設施與場景改善就能解決。經筆者調查，儘管街道安全指數很高，但感知的恐懼仍無法被消除。好比在寬敞明亮且安全無人商場，有時仍深感恐懼。

現階段增設都市設施做為安全感提升裝置有多種困難，本篇提出虛擬設施以及結合都市既有設施的想法。利用攝影機是街道的眼睛，攝影機的存在除了讓沿街面店家的安全得到保障，路人也因為受到監視而感到安全。隨著穿戴式裝置近年產品發布，更細緻維護人體感知的設備產生。筆者希望透過街頭攝影機、姿勢追蹤等科技，創造MR互動裝置，形成都市感知輔助的虛擬設施。本篇文章想針對攝影機如何捕捉骨架、將實體環境偵測點加入現階段建築學子使用之參數軟體Grasshopper，做階段性紀錄與分享。

現階段Mediapipe的實務應用

《An Integrated Real-Time Hand Gesture Recognition Framework for Human-Robot Interaction in Agriculture》（整合式農業領域中用於人機互動的即時手勢識別框架）是一篇探討在農業領域中用於人機互動的即時手勢識別框架的論文(Vasileios Moysiadis 2022)。

該論文提出了一個綜合的即時手勢識別框架，旨在促進農業領域中的人機互動。該框架基於深度學習技術，結合了手部姿勢檢測、關鍵點提取和手勢分類等關鍵步驟。研究團隊使用基於深度卷積神經網絡（CNN）的方法訓練模型，使其能夠準確地檢測和識別手部姿勢。改善農業領域中的人機互動體驗，提高農業生產效率具有重要意義。

Mediapipe Holistic全身辨識體感玩超級瑪莉

此案例為一個上傳至Youtube的實驗性影片，展示使用Mediapipe Holistic（一種全身姿勢識別技術）進行體感控制的超級馬里奧遊戲玩法。 Mediapipe Holistic是一種基於計算機視覺和機器學習的技術，能夠實時捕捉和識別人體的關鍵點和姿勢。通過該技術，玩家可以使用自己的身體動作來控制超級馬里奧遊戲中的角色。

這種體感玩法可以讓玩家更加身臨其境地參與遊戲，通過運動和動作來與遊戲進行互動，增強遊戲的樂趣和體驗。玩家可能需要使用自己的手臂、腿部或全身來模擬角色的跳躍、移動或其他動作，以完成遊戲中的任務和關卡。

這種基於Mediapipe Holistic的全身辨識體感玩法結合了計算機視覺和人機交互的技術，為遊戲提供了一種創新的操控方式。它可以帶來更加沉浸式的遊戲體驗，讓玩家能夠更直接、自然地參與到遊戲中。這種技術的應用展示了計算機視覺和人機交互領域在遊戲娛樂方面的潛力和創新(法蘭斯 2023)。

姿勢追蹤與改變感知的關係

為何以姿勢追蹤（或稱捕捉骨架，本文以姿勢追蹤稱呼）作為街道裝置的策略。姿勢的改變是可以影響人的情緒的。在《Standing tall and standing wide: Body positions have effects on how people feel》這篇研究中，主要探討身體姿勢如何影響人們情感狀態。研究者進行了一系列實驗，重點關注了兩種不同的身體姿勢：站得高和站得寬。他們通過觀察參與者在這兩種姿勢下的反應來研究姿勢與情感之間的關聯。

研究結果呈現，站得高的姿勢（例如挺胸、站直）與積極情感有關聯。參與者在站得高的姿勢下，所偵測的情緒報告有更高的自信感和力量感，同時表現出更積極的情緒狀態。這種姿勢可能有助於提升自尊和自信，以及改善情感體驗。

因此，這項研究表明身體姿勢可以對人們的情感狀態產生影響。站得高的姿勢有助於提升積極情感和自信感，而站得寬的姿勢則與風險承受能力和動機相關。這些發現有助於我們更好地理解身體姿勢與情感之間的關係，同時也為身體語言和情感調節領域的研究提供了新的視角(Körner 2022)。

由此研究可以理解，透過擴大姿勢，可以影響人的情緒。因此在情緒緊張的情況下，改變姿勢也是改善情緒的方式。故希望以姿勢追蹤的方式呈現互動裝置，透過裝置擾動人對於行走路徑的常態，改變姿態而轉換情緒。

實作與測試

筆者預期利用街道攝影機與互動模型連接，先依照文獻回顧的建議，整理成四個預期框架作為銜接方式。

1. 影機連接：將街道攝影機與嵌入式系統連接起來，以便獲取攝影機的影像。

2. 影像處理：使用適當的視訊處理庫或框架（例如OpenCV）讀取和處理攝影機的視訊流，成為MediaPipe提供處理的輸入數據(Fortes 2022)。

3. 整合MediaPipe：使用MediaPipe框架的相關模塊和功能，將錄影的影像傳遞到MediaPipe進行視覺感知處理。可以使用MediaPipe提供的預訓練模型，進行姿勢追蹤(Fortes 2022)。

4. 分析和應用：根據MediaPipe的輸出結果，進行分析進到虛擬模型裡面。

想針對從第四點延伸應用。利用media pipe抓取由點與線所構成的人體骨架，將MediaPipe框架整合到Grasshopper建模軟體中進行模型測試，並回測研究預期目的。進行的步驟如下：

１. 匯入MediaPipe模型：在Grasshopper中，使用Python程式語言，匯入MediaPipe模型。使用MediaPipe的功能和類別來處理及時影像數據。Mediapipe Holistic 集合了人體姿勢、面部標誌和手部追蹤三種模型與相關的演算法，可以偵測身體姿勢、臉部網格、手掌動作，完整偵測則會產生543 個偵測節點（33 個姿勢節點、468、個臉部節點和每隻手、21 個手部節點 )。(教育學習網)

2. 設定資料輸入和輸出：在Grasshopper中，利用plug-in: Ghowl作為資料輸入和輸出的介面，以便將MediaPipe框架的數據與grasshopper的互動模型進行交互。本研究是以攝影鏡頭捕獲即時視頻、載入預訓練模型、將資料傳遞給MediaPipe進行處理，並將結果的點位顯示在Grasshopper中，座位模型的控制點。

3. 設定資料輸入和輸出：在Grasshopper中，利用plug-in: Ghowl作為資料輸入和輸出的介面，以便將MediaPipe框架的數據與grasshopper的互動模型進行交互。本研究是以攝影鏡頭捕獲即時視頻、載入預訓練模型、將資料傳遞給MediaPipe進行處理，並將結果的點位顯示在Grasshopper中，座位模型的控制點。

4. 測試和除錯：確認確保資料能夠正確地從Grasshopper傳遞給MediaPipe，並正確地處理和顯示互動模型結果。

# source: https://steam.oxxostudio.tw/category/python/ai/ai-mediapipe-pose.html
# source: https://github.com/yucheno/opencv2gh/blob/master/opencv2GH.py
# 按 q 跳出

import mediapipe as mp
import cv2

# 設定 UDPsocket 與 pickle(專門用於python的json)
import socket
import json
def UDP_client(IP, port, message):
    sock = socket.socket(socket.AF_INET, socket.SOCK_DGRAM)
    sock.sendto(bytes(message, 'utf-8'), (IP, port))

設定銜接端口，銜接ghowl，請調整成自己的IP
IP = "127.0.0.1"
port = 5003
# 輸出資料


# 偵測骨架 並輸出 socket 等待接收
mp_drawing = mp.solutions.drawing_utils          # mediapipe 繪圖方法
mp_drawing_styles = mp.solutions.drawing_styles  # mediapipe 繪圖樣式
mp_pose = mp.solutions.pose                      # mediapipe 姿勢偵測

cap = cv2.VideoCapture(0)
#以上cap = cv2.VideoCapture(0)需視鏡頭位置調整(0)(1)(2)
# 啟用姿勢偵測
with mp_pose.Pose(
        min_detection_confidence=0.5,
        min_tracking_confidence=0.5) as pose:

    if not cap.isOpened():
        print("Cannot open camera")
        exit()
    while True:
        ret, img = cap.read()
        if not ret:
            print("Cannot receive frame")
            break
        # webcam 為 4:3 縮小尺寸，加快演算速度
        img = cv2.resize(img, (640, 480))
        img2 = cv2.cvtColor(img, cv2.COLOR_BGR2RGB)   # 將 BGR 轉換成 RGB
        results = pose.process(img2)                  # 取得姿勢偵測結果
        # 根據姿勢偵測結果，標記身體節點和骨架
        mp_drawing.draw_landmarks(
            img,
            results.pose_landmarks,
            mp_pose.POSE_CONNECTIONS,
            landmark_drawing_spec=mp_drawing_styles.get_default_pose_landmarks_style())

        # 使用 pickle 匯出為字串
        all = {'data': []}
        if results.pose_landmarks:
            for id, lm in enumerate(results.pose_landmarks.landmark):
                all['data'].append({
                    'x': lm.x,
                    'y': lm.y,
                    'z': lm.z,
                })

        outputjson = json.dumps(all, indent=4)
        UDP_client(IP, port, outputjson)

        cv2.imshow('oxxostudio', img)
        if cv2.waitKey(5) == ord('q'):
            break     # 按下 q 鍵停止
cap.release()
cv2.destroyAllWindows()

資料來源：

Fortes (2022). "Deep Learning based Human Pose Estimation using OpenCV and MediaPipe." from https://medium.com/nerd-for-tech/deep-learning-based-human-pose-estimation-using-opencv-and-mediapipe-d0be7a834076.
Jong-Wook KimORCID, J.-Y. C., Eun-Ju Ha,Jae-Ho Choi (2023). "Human Pose Estimation Using MediaPipe Pose and Optimization Method Based on a Humanoid Model." from https://www.mdpi.com/2076-3417/13/4/2700.
Körner, R. (2022). "Standing tall and standing wide: Body positions have effects on how people feel." AMERICAN PSYCHOLOGICAL ASSOCIATION.
Vasileios Moysiadis, D. K., Lefteris Benos,,Patrizia Busato ,Athanasios Anagnostis,Dimitrios Kateris ,Simon Pearson (2022). "An Integrated Real-Time Hand Gesture Recognition Framework for Human–Robot Interaction in Agriculture." applied science 12: 17.
法蘭斯 (2023). "Mediapipe Holistic全身辨識體感玩超級瑪莉." from https://www.youtube.com/watch?v=1ZjmQEVsHdE.
教育學習網, S. "Mediapipe 全身偵測 ( Holistic )." from https://steam.oxxostudio.tw/category/python/ai/ai-mediapipe-holistic.html.
課程學習：TKU=建築系碩士班=BIM工程整合應用實務授課老師：蕭吉甫

留言

張瑋凌的沙龍

42會員

16內容數

>_為終端機的圖標，思想的問答平台。跨領域結合／程式語言／建築理論／數位應用／環境議題／機器學習／互動裝置／系統科學

張瑋凌的沙龍的其他內容

2023/02/14

以互動介面製作危險指認回測模型降低夜歸危險感知

關鍵字：危險感知、數據分析、互動介面、機器學習現今的公共空間時常存在潛在危險，危險感知通常來自心理層面的情緒知覺或認知。若是產生一個顯示認知危險的視覺地圖，並且當遊走在市街的使用者發現新的場域，能立即回報加入地圖資訊，成為一個及時回饋機制。

2023/02/14

以互動介面製作危險指認回測模型降低夜歸危險感知

2022/09/03

論文隨筆02 　影片大量截圖

發展一種，教導機器學習人類辨識，作為設計發展的工作流程=影像大量截圖

2022/09/03

論文隨筆02 　影片大量截圖

發展一種，教導機器學習人類辨識，作為設計發展的工作流程=影像大量截圖

2021/11/11

台北切片

都市的成長無可避免是通往廢墟化的過程，如何透過基礎設施了解都市，並透過異質空間產生新的生活想像。

2021/11/11

台北切片

都市的成長無可避免是通往廢墟化的過程，如何透過基礎設施了解都市，並透過異質空間產生新的生活想像。

看更多

你可能也想看

釀電影，啜一口電影的美好。

《傳奇：帕拉贊諾夫的十段殘篇》：以流亡書寫帕拉贊諾夫的政治寓言

賽勒布倫尼科夫以流亡處境回望蘇聯電影導演帕拉贊諾夫的舞台作品，以十段寓言式殘篇，重新拼貼記憶、暴力與美學，並將審查、政治犯、戰爭陰影與「形式即政治」的劇場傳統推到台前。本文聚焦於《傳奇：帕拉贊諾夫的十段殘篇》的舞台美術、音樂與多重扮演策略，嘗試解析極權底下不可言說之事，將如何成為可被觀看的公共發聲。

#釀電影#釀評論#藝術評論

2026/01/14

釀電影，啜一口電影的美好。

《傳奇：帕拉贊諾夫的十段殘篇》：以流亡書寫帕拉贊諾夫的政治寓言

#釀電影#釀評論#藝術評論

2026/01/14

趙鐸的沙龍

柏林劇團《三便士歌劇》：善讓人嚮往，惡卻更加迷人──布萊希特的疏離與慾望

柏林劇團在 2026 北藝嚴選，再次帶來由布萊希特改編的經典劇目《三便士歌劇》（The Threepenny Opera），導演巴里・柯斯基以舞台結構與舞台調度，重新向「疏離」進行提問。本文將從觀眾慾望作為戲劇內核，藉由沉浸與疏離的辯證，解析此作如何再次照見觀眾自身的位置。

#2026北藝嚴選#臺北表演藝術中心#北藝嚴選

2026/01/14

趙鐸的沙龍

柏林劇團《三便士歌劇》：善讓人嚮往，惡卻更加迷人──布萊希特的疏離與慾望

#2026北藝嚴選#臺北表演藝術中心#北藝嚴選

2026/01/14

花神沒有咖啡館的沙龍

《海妲．蓋柏樂》：晃晃跨幅町直球對決經典，解構現代女性的困頓與慾望

本文深入解析臺灣劇團「晃晃跨幅町」對易卜生經典劇作《海妲．蓋柏樂》的詮釋，從劇本歷史、聲響與舞臺設計，到演員的主體創作方法，探討此版本如何讓經典劇作在當代劇場語境下煥發新生，滿足現代觀眾的觀看慾望。

#2026北藝嚴選#北藝嚴選#臺北表演藝術中心

2026/01/14

花神沒有咖啡館的沙龍

《海妲．蓋柏樂》：晃晃跨幅町直球對決經典，解構現代女性的困頓與慾望

#2026北藝嚴選#北藝嚴選#臺北表演藝術中心

2026/01/14

涵柳的沙龍

《轉轉生 Re:INCARNATION》：從身體與服裝看見奈及利亞的重生

《轉轉生》為奈及利亞編舞家庫德斯．奧尼奎庫與 Q 舞團創作的當代舞蹈作品，融合舞蹈、音樂、時尚和視覺藝術，透過身體、服裝與群舞結構，回應殖民歷史、城市經驗與祖靈記憶的交錯。本文將從服裝設計、身體語彙與「輪迴」的「誕生—死亡—重生」結構出發，分析《轉轉生》如何以當代目光，形塑去殖民視角的奈及利亞歷史。

#2026北藝嚴選#北藝嚴選#臺北表演藝術中心

2026/01/14

涵柳的沙龍

《轉轉生 Re:INCARNATION》：從身體與服裝看見奈及利亞的重生

#2026北藝嚴選#北藝嚴選#臺北表演藝術中心

2026/01/14

觸康健肌應學

觸康健®肌應學：從緊繃不適到自在騎行的奇妙轉變

觸康健®的調和不僅僅是對身體肌肉系統的結構性評估，而是透過經絡肌能檢測，對身體內部精密的生物電腦進行判讀，以降低結構、情志、生化的各端點帶來的壓力，實現身心的安康。

#AySu肌應學調和#觸康健肌應學#肌應學

2024/04/12

觸康健肌應學

觸康健®肌應學：從緊繃不適到自在騎行的奇妙轉變

#AySu肌應學調和#觸康健肌應學#肌應學

2024/04/12

觸康健肌應學

觸康健®肌應學一階綜合課程：啟發身體的覺察&平衡之旅

如何透過生理測試/情緒測試/生化測試找出準確的指標肌肉，並且在調和前做事前檢查-迴路檢測/任脈檢測/充水度檢測，而在肌肉調和的方法則有脊椎反射、神經淋巴按揉點、神經血脈觸點、掃經、肌肉起止點技巧、利用食物強化肌肉。

#AySu肌應學調和#觸康健肌應學#肌應學

2024/02/29

觸康健肌應學

觸康健®肌應學一階綜合課程：啟發身體的覺察&平衡之旅

#AySu肌應學調和#觸康健肌應學#肌應學

2024/02/29

張瑋凌的沙龍

MediaPipe結合Grasshopper進行互動設計

本篇提出虛擬設施以及結合都市既有設施的想法。利用攝影機是街道的眼睛，攝影機的存在除了讓沿街面店家的安全得到保障，路人也因為受到監視而感到安全。筆者希望透過街頭攝影機、姿勢追蹤等科技，創造MR互動裝置，形成都市感知輔助的虛擬設施。本篇文章想針對攝影機如何捕捉骨架、將實體環境偵測點加入現階段建築學子使用

#攝影機#互動#模型

2023/07/09