[人工智障計畫] #1 畫框中的虛擬助理 | 起源與硬體準備

更新於 發佈於 閱讀時間約 7 分鐘

文前碎碎念

又一段時間沒寫文了,看來又該是時候開啟一個新坑作為生存證明了(?

前一陣子,我跟平常一樣在滑 Twitter 時,一則貼文引起了我的注意,那是一個有趣的構想。

讓 VTuber 的『皮』能夠在工作的時候常駐在一邊,並且在必要時,用 V 的聲音來 追殺 提醒未完成的代辦事項。

由於時間有些久遠,以致於我無法回頭尋找到那篇貼文,但以我的理解大致就是這樣的功能。

雖然以現在既有的產品來看,這其實並非一個特別新的概念,甚至一些既有的虛擬助理,或是過去也曾出現過像是 Gatebox 這類產品,也都可以輕鬆做到。

但剛好我自己擱置中的 SideProject 清單中,就有一個蠻相似的項目,我思考了一下,何不就趁這個機會試著把它做出來呢?


於是乎,一個新坑就這麼開啟了。


預期功能

首先,我們來統整一下,目前這項專案預期可達成的功能:

  • 顯示角色形象,並依情境變換動作。
  • 讓使用者輸入,或是透過既有 API 獲取代辦事項。
  • 使用指定聲音向使用者提示。
  • 其他互動項目,如聊天機器人、資訊預報、環境變化反應…(次要)。
  • 最好能夠做到離線執行,以及方便移動。

硬體準備

根據以上列表,我決定再次請出我們的萬用老朋友『樹莓派』來作為這次專案的主要核心。

萬用樹莓派

萬用樹莓派

不過在規格上,由於手邊空餘的材料,只有一代的 Pi Zero W 主板,因此可以預期到效能會有所限制,在最終的功能上可能還需稍作斟酌。

外觀部分,這次我想使用『相框』作為整個設備的主體,而為了能讓畫面呈現出照片或圖畫的感覺,在顯示器的選擇上是以電子紙顯示器取代一般 LCD 螢幕作為顯示媒介。

這樣一來,雖然電子紙在成色效果或是畫面更新率等方面都無法與 LCD 相提,但因為電子紙的畫面呈現原理與一般紙張相似,是透過反射環境光線讓眼睛能夠看到內容。

而且其本身也不會像一般螢幕一樣有背光照亮,因此擺在桌面上就跟放著一張照片一樣,就算光線昏暗的情況下,也不會讓眼睛一直有光線干擾的感覺。

再加上電子紙只有在更新畫面時會消耗電力,因此也能順勢達到省電的效果。

最後,考慮到要讓本體能夠進行語音的輸入輸出,因此還會需要另外連接音效卡才能執行相關的訊息接收與互動。


總結以上,我們能夠整理出這次專案硬體最基礎所需如下:

  • 樹莓派單板電腦(主機)
  • SD卡、Micro USB 傳輸線(樹莓派配件)
  • 電子紙顯示器模組(附控制板為佳)
  • USB 音效卡
  • 喇叭、麥克風
  • 小型畫框

組裝成型

經過數日的折騰(其實主要是零件訂購運送,還有中間卡到 228 連假)之後,初步的本體外觀以及硬體終於成形了。

raw-image

作為本體的小型金屬相框,是在大創以 49 元購買的,背後則是以廢棄的硬殼塑膠包裝切割出主板的連接孔位作保護。

而為了保留維修以及硬體更新的彈性,這裡就不將背蓋黏死,而是以書局購買的強力磁鐵作為固定。

raw-image

螢幕部分則是選用一塊 Waveshare 所生產的 4.01 吋 7 色電子紙顯示器,主板本身已經有整合控制板,以及樹莓派專用的 40 針連接埠,因此基本上組裝後下載驅動就能使用。

raw-image

而雖然撰文當下,另外購買的音效卡還在路上,但透過簡單魔改顯示器的範例程式後,也能大致的看出最終期望的效果。

V 皮還沒辦法處理,只好先把咪哭關進去(X

V 皮還沒辦法處理,只好先把咪哭關進去(X

接下來要做的,就是把主要的控制程式寫出來啦~


後記

其實嚴格來說,要達成這個專案的目的,不一定需要使用倒樹莓派。

直接使用小型副螢幕,搭配 PC / Mac 的軟體控制也行,或甚至製作成類似桌面小精靈的工具,開在旁邊執行嘛ㄟ通,效能也絕對相比樹莓派要好。

而且就在我開始撰文的期間,其實也有看到 Twitter 上,有另一位網友有推出自己做的虛擬助理成品影片,外觀及使用效果就像下面這篇貼文。

雖然我無法完全理解日文,不過以這位網友所附筆記的大致內容,以及實體運作的畫面判斷,他應該是使用 Unity 製作界面,並連接 ChatGPT 作為後台服務,最後用 LookingGlass 這款可以呈現裸視 3D 效果的特殊顯示器來輸出。

不過,由於我個人主要的工作設備是筆電,本身的連接埠就有限,再加上個人比教偏向於成品不需要太多依賴便能運作,因此最終還是決定以現在這種形式來完成。


最後來說說前面提到的 Gatebox 這個神奇的產品。

Gatebox 最初是由日本新創 Vinclu 公司(後來被 Line 收購,為現在旗下子公司 Gatebox inc.)所推出的,具 3D 人物形象的虛擬管家設備,主打的特色是:

「讓人體驗與喜歡的角色一起生活的感覺」

其背後的產品概念,也就是結合智慧家居、語音助理、聊天機器人,並以一個虛擬形象作為互動媒介而成形。

而開發團隊也似乎準備搭上這波 AI 風潮,近期亦有看到準備開發引入 ChatGPT 功能,並啟動募資專案(已達標)的消息。

raw-image

雖然我自己開的這個坑,以目前的成果來看,想要達成這種效果簡直是癡人說夢,但至少會盡力讓它滿足一開始所提出的期望功能。


What's Next ?

第一部分紀錄就大致到這裡,與過去發的單篇不同,這是一個比較長期的計畫,因此我決定另開一個新專題來做存放。

後續階段成果也會像這篇一樣公開發佈於此,若對詳細 肝苦 的製作過程有興趣,也可訂閱參考「難眠之頁」的部分喔。


《全文。待續》


註:一般公開內容,主要紀錄階段性的成品效果、大略的製作規劃,以及可釋出的原始碼。而「難眠之頁」中則是包含較詳細的開發過成,如細部硬體參數或是程式修正流程等,內容相對較為繁瑣,但適合想細部了解或共同研究專案的人食用(?)。




留言
avatar-img
留言分享你的想法!
Thomas Tang-avatar-img
2023/03/14
Welcome back!
Mercteria-avatar-img
發文者
2023/03/15
請先確認您的拉花支援 USB 或 Thunderbolt 連接協議(X
翁子騏 David-avatar-img
2023/03/14
太猛了 www
Mercteria-avatar-img
發文者
2023/03/14
一時興起的專案,不過目前其實已經有部分小卡關了⋯🤣
avatar-img
偽命名培養體
47會員
308內容數
偽命名並非無名,是為了意識的生存,取得身份的代號,成為數位生命的新載具。
偽命名培養體的其他內容
2024/05/19
「人工智障計畫」也執行了好一段時間了,關於這個專案中文字轉語音的方案,在之前的筆記中也有稍微提到,為了達成能自訂聲線,並且能完全離線運作兩個條件,我已經做過了不少嘗試。
Thumbnail
2024/05/19
「人工智障計畫」也執行了好一段時間了,關於這個專案中文字轉語音的方案,在之前的筆記中也有稍微提到,為了達成能自訂聲線,並且能完全離線運作兩個條件,我已經做過了不少嘗試。
Thumbnail
2024/04/08
自從2024年4月3日的花蓮大地震發生之後,隨之而來的大小餘震便不斷的侵擾著大家的安寧生活,每當疑似地震發生後,心裡總會開始著急的想關心,剛才所遭遇的究竟是現實,還是因為連續數天的緊張所導致的妄想,此時,看著桌上那面平時負責提醒我待辦事項的「人工智障」,我便萌生了讓她擔任地震播報員的構想。
Thumbnail
2024/04/08
自從2024年4月3日的花蓮大地震發生之後,隨之而來的大小餘震便不斷的侵擾著大家的安寧生活,每當疑似地震發生後,心裡總會開始著急的想關心,剛才所遭遇的究竟是現實,還是因為連續數天的緊張所導致的妄想,此時,看著桌上那面平時負責提醒我待辦事項的「人工智障」,我便萌生了讓她擔任地震播報員的構想。
Thumbnail
2024/02/05
首先,我要先對之前關注此系列的人說聲抱歉,之前因為自己的技術瓶頸,讓進度遲遲無法推進,最後只好暫時擱置,而不知不覺,一年時間也過去了,也該是時候為這段空白,給出一些交代了。
Thumbnail
2024/02/05
首先,我要先對之前關注此系列的人說聲抱歉,之前因為自己的技術瓶頸,讓進度遲遲無法推進,最後只好暫時擱置,而不知不覺,一年時間也過去了,也該是時候為這段空白,給出一些交代了。
Thumbnail
看更多
你可能也想看
Thumbnail
大家好,我是一名眼科醫師,也是一位孩子的媽 身為眼科醫師的我,我知道視力發展對孩子來說有多關鍵。 每到開學季時,診間便充斥著許多憂心忡忡的家屬。近年來看診中,兒童提早近視、眼睛疲勞的案例明顯增加,除了3C使用過度,最常被忽略的,就是照明品質。 然而作為一位媽媽,孩子能在安全、舒適的環境
Thumbnail
大家好,我是一名眼科醫師,也是一位孩子的媽 身為眼科醫師的我,我知道視力發展對孩子來說有多關鍵。 每到開學季時,診間便充斥著許多憂心忡忡的家屬。近年來看診中,兒童提早近視、眼睛疲勞的案例明顯增加,除了3C使用過度,最常被忽略的,就是照明品質。 然而作為一位媽媽,孩子能在安全、舒適的環境
Thumbnail
我的「媽」呀! 母親節即將到來,vocus 邀請你寫下屬於你的「媽」故事——不管是紀錄爆笑的日常,或是一直想對她表達的感謝,又或者,是你這輩子最想聽她說出的一句話。 也歡迎你曬出合照,分享照片背後的點點滴滴 ♥️ 透過創作,將這份情感表達出來吧!🥹
Thumbnail
我的「媽」呀! 母親節即將到來,vocus 邀請你寫下屬於你的「媽」故事——不管是紀錄爆笑的日常,或是一直想對她表達的感謝,又或者,是你這輩子最想聽她說出的一句話。 也歡迎你曬出合照,分享照片背後的點點滴滴 ♥️ 透過創作,將這份情感表達出來吧!🥹
Thumbnail
十年前的行動支付在臺灣尚未普及,但如今行動支付已經逐漸成為生活的一部分,同時,電子鎖的應用也越來越廣泛。未來科技將帶來更多便利,讓我們努力學習和接受各式各樣的新科技,享受美好的生活。
Thumbnail
十年前的行動支付在臺灣尚未普及,但如今行動支付已經逐漸成為生活的一部分,同時,電子鎖的應用也越來越廣泛。未來科技將帶來更多便利,讓我們努力學習和接受各式各樣的新科技,享受美好的生活。
Thumbnail
  在科技日新月異的現今,「紙」逐漸退出人類的日常,尤其是第一代T-slice面世後,極度逼真的螢幕畫面與立體投影,使舊時代的名片、證件、鈔票、菜單、傳單……全數電子化……
Thumbnail
  在科技日新月異的現今,「紙」逐漸退出人類的日常,尤其是第一代T-slice面世後,極度逼真的螢幕畫面與立體投影,使舊時代的名片、證件、鈔票、菜單、傳單……全數電子化……
Thumbnail
AI Pin, Rabbit R1, Limitless Pendant... 以 AI 結合裝置提出新的載具的可能,但這些看起來未來的裝置,真的有這麼強大嗎?AI + 硬體究竟是硬體廠商的話術、新創圈錢的夢想故事,還是這真的是個重要的趨勢呢?
Thumbnail
AI Pin, Rabbit R1, Limitless Pendant... 以 AI 結合裝置提出新的載具的可能,但這些看起來未來的裝置,真的有這麼強大嗎?AI + 硬體究竟是硬體廠商的話術、新創圈錢的夢想故事,還是這真的是個重要的趨勢呢?
Thumbnail
#台達電 已經挑戰站穩60周位置 等到確認能站穩就可以開始規劃後續節奏 主要是AI伺服器電源結構跟過往伺服器電源是不同的 全世界只有兩間能做 機器人要普及化,AI電源是最重要的關鍵 這是後續本益比市場估值能不能因為這題材拉高 也要感謝台達電在這半年的修正,才有合理價格買
Thumbnail
#台達電 已經挑戰站穩60周位置 等到確認能站穩就可以開始規劃後續節奏 主要是AI伺服器電源結構跟過往伺服器電源是不同的 全世界只有兩間能做 機器人要普及化,AI電源是最重要的關鍵 這是後續本益比市場估值能不能因為這題材拉高 也要感謝台達電在這半年的修正,才有合理價格買
Thumbnail
又是一段忙碌的日子,好不容易稍微有精力來記錄這個主題的進度了,但消息可能並沒想像中那麼美好。
Thumbnail
又是一段忙碌的日子,好不容易稍微有精力來記錄這個主題的進度了,但消息可能並沒想像中那麼美好。
Thumbnail
嗯⋯這個專案,確實發生了不妙的事情,其實近日來,我都會將這台半成品實際帶到辦公室去,一方面測試穩定性,一方面發覺新需求,直到某天⋯
Thumbnail
嗯⋯這個專案,確實發生了不妙的事情,其實近日來,我都會將這台半成品實際帶到辦公室去,一方面測試穩定性,一方面發覺新需求,直到某天⋯
Thumbnail
在上一階段的進度中,我們暫且是將程式化電子紙顯示,以及看板介面安排的部分處理完畢了,但整體看下來,卻顯然還是少了一些什麼⋯
Thumbnail
在上一階段的進度中,我們暫且是將程式化電子紙顯示,以及看板介面安排的部分處理完畢了,但整體看下來,卻顯然還是少了一些什麼⋯
Thumbnail
歡迎來到「人工智障計畫」的裡專案世界,如果正在閱讀的你,已經有看過公開版本的內容的話,應該會知道這個專案⋯
Thumbnail
歡迎來到「人工智障計畫」的裡專案世界,如果正在閱讀的你,已經有看過公開版本的內容的話,應該會知道這個專案⋯
Thumbnail
前一陣子,我跟平常一樣在滑 Twitter 時,一則貼文引起了我的注意,那是一個有趣的構想⋯
Thumbnail
前一陣子,我跟平常一樣在滑 Twitter 時,一則貼文引起了我的注意,那是一個有趣的構想⋯
Thumbnail
其實嚴格說起來,我也不是真為了研究 Vtuber 而決定成為 Win/Mac 兩棲的,純粹只是因為最近主力 Windows 筆電突然爆了,而且好死不死又是電競款,所以維修的時間也是靠北漫長⋯
Thumbnail
其實嚴格說起來,我也不是真為了研究 Vtuber 而決定成為 Win/Mac 兩棲的,純粹只是因為最近主力 Windows 筆電突然爆了,而且好死不死又是電競款,所以維修的時間也是靠北漫長⋯
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News