語言不再是障礙,AI用你的聲音說世界的話!即時口譯機。《未來產品預言》

閱讀時間約 3 分鐘
raw-image


AI現在很紅,本來覺得我講什麼都很無聊,更別說翻譯軟體了。不過,每次我都在跟學生說設計創新思維的[微觀]與[宏觀],我也不能每次都只是嘴上說說,每次都在打屁。該再次預言一下未來的產品了:即時同步口譯機!

產品特色如下:

  1. 即時同步雙向翻譯
    (這一點真的很普通)
  2. 即時記錄轉換為文字筆記
    (開會紀錄專用神器)
  3. 個人聲音同步發聲
    (AI模擬我的聲音講出各國語言)

說真的,第一點和第二點都很普通,現在很多產品都在做了。我想和大家分享的是更夢幻的第三點,也就是我預言未來各家翻譯軟體在戰場上決勝負的關鍵點:聲音

我先老實說,我的英文蠻差的,大多只會一些單字、屁話和電影台詞,就這樣了。所以我更能體會翻譯軟體有多方便。尤其自從有了ChatGPT後,根本是聽說讀寫樣樣行!

但不管翻譯軟體再強大,一開口說話,總是讓我莫名感到發麻。自從我看到現在的AI可以模仿人類的聲音後,我馬上開啟了有廣度的思維模式,開始點、線、面的超連結。(最近人生忙碌,所以這篇文章晚了快半年才寫出來,哈哈)

大家應該還記得一年前的新聞吧,AI模仿孫燕姿唱歌!再過不到一個月,又陸續出現了許多AI模仿親人朋友的語音詐騙。AI學習我們的聲音簡直就像本人,天啊!而且需要的數據量只要數十秒,就能達到7到8成的相似度,這才是驚人的地方!

未來的口譯機第一次開機時,對著APP念一篇短文章,透過分析與記憶後,會模擬我們說話的語氣與口音。如果你平常講中文時口氣輕鬆幽默,AI會將這些習慣記錄下來,當你說中文時,口譯機會自動翻譯,並同步用你的聲音把對方需要聽的語言傳達過去,還有相同的情感與口氣。

raw-image


我想,未來聯合國的高峰會議應該會是第一個大量買入這款產品的單位吧。畢竟每次聯合國開會,口譯人員一旦出錯,新聞媒體上就會鬧出不少笑話。不過,我也覺得聯合國高峰會議是最不適合用AI翻譯的場合。畢竟國與國之間的攻防戰中,AI翻譯目前還無法像老狐狸一樣判斷當下局勢,隨時調整那些該說或不該說的話。

人類翻譯之所以強大,是因為他們的專業在於理解溝通的美學

總結:學英文很重要,真的非常重要。但如果你時間有限,那你不如專注於自己的技能強項,磨練到極致。期待科技解決問題(本人就是逃避學英文很久了...)。


raw-image

未來的視訊軟體必定有

最後也最快會看到的,我猜是各家的視訊會議軟體,可以想像,再過1~2年,未來的視訊軟體,都可以安裝此功能,讓不同國家的人們在視訊會議上,同步語音雙向翻譯發聲,未來一場跨國際視訊會議上面,全世界的使用者都可以用自己的聲音來說出多國語言,達到語言無限溝通的最高境界。


媽的,我真的是天才啊!但我想應該也有不少人想到這一點,只是苦於整合性與商業利益是否能相互呼應罷了。


當然這些都是良善的用途,如果放在不法的用途上,其實是最可怕的科技運用...

希望這篇文章大家會喜歡,也歡迎大家追蹤我的文章

期待與各位討論更多有趣的關於商模與產品的未來預言!!

未來預言家Higer


本文原文發布於2023年11月

原文連接





如何成為不被AI取代的未來人才,一起學習思維的多元化與同理心的培養,最重要的是用換了設計脫口秀的方式看這嚴肅的世界。 運用長年的累積的多元資訊與實戰經驗數據庫 加上敏銳的社會觀察洞見,洞察未來的產品之路,給您有效的洞見與合理的解法 讓您的產品提前>邁向未來 。
留言0
查看全部
發表第一個留言支持創作者!
本文探討心理學中的峰終定律(Peak-End Rule),並介紹如何利用該理論設計顧客體驗,讓顧客一再回來。從酒店公關的情感共鳴、女僕咖啡廳的魅力互動,到奢侈品牌的期望與購入體驗,以及小紅書推播的設計,這些都反映出高峰和結尾在顧客記憶中的重要性,從而建立起與品牌的情感連結,增強顧客忠誠度。
本文探討心理學中的峰終定律(Peak-End Rule),並介紹如何利用該理論設計顧客體驗,讓顧客一再回來。從酒店公關的情感共鳴、女僕咖啡廳的魅力互動,到奢侈品牌的期望與購入體驗,以及小紅書推播的設計,這些都反映出高峰和結尾在顧客記憶中的重要性,從而建立起與品牌的情感連結,增強顧客忠誠度。
你可能也想看
Google News 追蹤
Thumbnail
這個秋,Chill 嗨嗨!穿搭美美去賞楓,裝備款款去露營⋯⋯你的秋天怎麼過?秋日 To Do List 等你分享! 秋季全站徵文,我們準備了五個創作主題,參賽還有機會獲得「火烤兩用鍋」,一起來看看如何參加吧~
Thumbnail
人工智慧是什麼? 人工智慧(Artificial Intelligence, AI) 簡單來說,就是讓機器模仿人類的思考、學習和決策的能力。它就像是一個聰明的電腦程序,可以執行許多原本需要人類智慧才能完成的工作,例如: 語音辨識: 讓電腦聽懂人類的語言,像是 Siri、Google As
Thumbnail
AI對語言學習的衝擊 自從ChapGPT橫空出世,大家開始真正感受到AI真的來了,最起碼它在語言這塊已經可以做到接近完美的程度,很多人甚至開始懷疑到底我們還需要學習英文嗎?畢竟現在人手一機,再加上AI的應用,基本就是帶了一個會行走的翻譯機,以後出國再也不用擔心語言的問題,是不是翻譯已經變成是一項可
Thumbnail
沉浸式翻譯是一款多功能的瀏覽器插件和手機APP,專門為僅懂中文的使用者打造。它支援瀏覽器的擴充插件,也支援手機APP,並且提供多項功能,包括實時雙語字幕翻譯、PDF翻譯功能、雙語EPUB電子書,以及鼠標懸停翻譯等。欲瞭解更多請訪問官網。
Thumbnail
科技發達,AI智能也越來越發達。 蠢孩子,我每篇小說的圖片都是用AI製作的唷!!
Thumbnail
遇到故障申告或客服問題時,經常需要與語音系統對話,但這樣的狀況只會越來越多。這篇文章描述了作者與AI語音系統的故障申告對話過程,以及對未來科技與人性關係的思考。作者透過個人經驗探討了人與機器的互動,以及可能面臨的情感抽離和機械化。透過文章,探討了AI是否在訓練和影響人類,最終進化人類的人性。
Thumbnail
要如何做到無須任何額外訓練樣本就能做到"跨語言"的語音生成,這聽起來很不可思議對吧? 但這就是本篇論文取得的成就,不僅如此,該有的功能,如調整情感,口音節奏,停頓語調這些功能也不在話下。跟著我一起用探秘還有獨立思考的眼光來分析這篇論文,這會是很有趣的旅程。
Thumbnail
ChatGPT最近更新了語音對話功能,同時推出了附屬功能Read out loud,讓對話更方便。使用者可以立刻知道英文單字的讀音和例句唸法,加上十秒重播功能,非常實用。
Thumbnail
ChatGPT最擅長的就是文本處理,用來翻譯字幕應該也是一片蛋糕吧!但實際操作測試,卻發現沒那麼容易,原因是影片翻譯要考量的因素太多包括: ▪️時間戳記對齊 ▪️適合閱讀且中英文對照文句長度 ▪️貼合講者原意語氣風格 ▪️專業術語與專有名詞 還有GPT一次可以處理的資訊量有限,超過
Thumbnail
這個秋,Chill 嗨嗨!穿搭美美去賞楓,裝備款款去露營⋯⋯你的秋天怎麼過?秋日 To Do List 等你分享! 秋季全站徵文,我們準備了五個創作主題,參賽還有機會獲得「火烤兩用鍋」,一起來看看如何參加吧~
Thumbnail
人工智慧是什麼? 人工智慧(Artificial Intelligence, AI) 簡單來說,就是讓機器模仿人類的思考、學習和決策的能力。它就像是一個聰明的電腦程序,可以執行許多原本需要人類智慧才能完成的工作,例如: 語音辨識: 讓電腦聽懂人類的語言,像是 Siri、Google As
Thumbnail
AI對語言學習的衝擊 自從ChapGPT橫空出世,大家開始真正感受到AI真的來了,最起碼它在語言這塊已經可以做到接近完美的程度,很多人甚至開始懷疑到底我們還需要學習英文嗎?畢竟現在人手一機,再加上AI的應用,基本就是帶了一個會行走的翻譯機,以後出國再也不用擔心語言的問題,是不是翻譯已經變成是一項可
Thumbnail
沉浸式翻譯是一款多功能的瀏覽器插件和手機APP,專門為僅懂中文的使用者打造。它支援瀏覽器的擴充插件,也支援手機APP,並且提供多項功能,包括實時雙語字幕翻譯、PDF翻譯功能、雙語EPUB電子書,以及鼠標懸停翻譯等。欲瞭解更多請訪問官網。
Thumbnail
科技發達,AI智能也越來越發達。 蠢孩子,我每篇小說的圖片都是用AI製作的唷!!
Thumbnail
遇到故障申告或客服問題時,經常需要與語音系統對話,但這樣的狀況只會越來越多。這篇文章描述了作者與AI語音系統的故障申告對話過程,以及對未來科技與人性關係的思考。作者透過個人經驗探討了人與機器的互動,以及可能面臨的情感抽離和機械化。透過文章,探討了AI是否在訓練和影響人類,最終進化人類的人性。
Thumbnail
要如何做到無須任何額外訓練樣本就能做到"跨語言"的語音生成,這聽起來很不可思議對吧? 但這就是本篇論文取得的成就,不僅如此,該有的功能,如調整情感,口音節奏,停頓語調這些功能也不在話下。跟著我一起用探秘還有獨立思考的眼光來分析這篇論文,這會是很有趣的旅程。
Thumbnail
ChatGPT最近更新了語音對話功能,同時推出了附屬功能Read out loud,讓對話更方便。使用者可以立刻知道英文單字的讀音和例句唸法,加上十秒重播功能,非常實用。
Thumbnail
ChatGPT最擅長的就是文本處理,用來翻譯字幕應該也是一片蛋糕吧!但實際操作測試,卻發現沒那麼容易,原因是影片翻譯要考量的因素太多包括: ▪️時間戳記對齊 ▪️適合閱讀且中英文對照文句長度 ▪️貼合講者原意語氣風格 ▪️專業術語與專有名詞 還有GPT一次可以處理的資訊量有限,超過