在新聞室裡做 GAI
avatar-img
CT

在新聞室裡做 GAI

更新於 發佈於 閱讀時間約 6 分鐘

久違更新近況。

一直以來實在相當感謝機緣,雖然不總總在自己需要或想要的時刻來臨(過於奢侈),但感謝願意相信的長輩、朋友,給予諸多機會和關懷。

比起大學至碩一以前發文頻繁,這兩年只有偶爾在臉書上更新(近期還都是棒球XD),這樣的頻率近期應該不會有太大的變動。


2021年同時入學了生資所與新聞所、2022年生資碩士畢業。在2023年新聞所碩二結束後,想說不枉新聞所一場,實在是真的很想當記者(或更定義清楚可能偏向資料記者)看看,哪怕短期的實習記者,希望能伴隨碩三的研究生活,把握年輕、學生身份去嘗試,或能找到未來的明確動向。

必須說大學時期幾乎把時間奉獻給(相對比較基礎科學的)實驗室,真心很想去業界看看,曾經也投過幾個實習無果,而這次投了幾家心儀且崇拜的媒體團隊(天下、關鍵...),實習缺無果,正職缺對部分媒體來說仍有疑慮(在學身份,但其實已經努力辯護自己已經沒有課了)。

也算是做過夢了,決定先去當兵沉澱。

2023年11月服替代役至隔年5月,感謝北市原民會,遇到很好的鄰兵&同事、還算舒適的工作環境,算是體驗/觀察了半年的公務員(打雜)生活。

原民會打雜生活

原民會打雜生活


結束服役生涯,很意外的在因緣際會下,七月進入了中央社媒體實驗室

今年續約的公告(其實蠻酷的,竟然還會被貼出來XD)

今年續約的公告(其實蠻酷的,竟然還會被貼出來XD)


過去大家(媒體圈)對媒體實驗室的印象大概都是持續推出很不錯的數位敘事專題,酒駕報導水果戰士議員提案專題...,很多都很有印象。但我進去的當下,媒體實驗室開始減少了專題產製,轉而做關於 AI 、NLP 結合應用在新聞編輯室,從專題團隊變成類似資訊 RD 團隊,雖然這樣的編制在媒體裡面大概極少見(或者感覺沒見過(?) ),畢竟如果有專業大量的需求,大概媒體會選擇外包居多(?)。但撇開無論是自我成長還是各項條件看,至今回想起來仍慶幸自己能參與其中。

身邊的朋友如果有聽說的話,過去曾經說過「好想在媒體業當一個工程師」這類話,至少在現階段竟然有點莫名的實現了。可以寫 code 之餘,聽聽daily、編輯台、專題的腦力激盪跟專題生成,就算自己沒參與(但很想參與XD)還是很快樂。

AI,對於理工人來說早就不是什麼新名詞。各種機器學習演算法早就已經充斥在每日課程中。生資背景來看,那些蛋白質結構預測,也都 AI 在裡面。所以比起講 AI,想要更限縮談的是「GAI(生成式 AI,Generative Artificial Intelligence)」。

這段時間中,世界發生了劇烈變化。ChatGPT 橫空出世,不僅衝擊文字工作者,更漸漸也衝擊了軟體開發者(甚至針對「半路出家」的軟體開發者)。聊天機器人本來就不是舊名詞,但能讓機器賦予思考、推理能力,做的「像人」、「幾乎就是人」,ChatGPT 出現是一個相當大的突破。

在媒體實驗室開始做的各項專案,除了思考 GAI 應用在 newsroom 的機會,GAI 也開始介入了自己的開發流程。

(不禁感嘆大學四年努力與血淚讓死腦筋學會的程式,這個時代開始寫程式的人只要用力一個月幾乎等於我的大學四年......)

跟AI合作開發了AI下標、AI配圖(AI-powered image/video search),與同事合作新聞事件摘要(私心很喜歡這部分),結合斷詞廠商與同事思考建立萃取關鍵字的機制。

此外,自己雖然會前端,但也從不會寫 Chrome Extension,因此這次也與AI合作做了「志明編輯助手」將這些「AI組合拳」統合為一,供編輯、記者使用。

最一開始志明助手版本

最一開始志明助手版本

大概比起科技業,我們看來沒有特別嚴謹的產品開發的流程。這個外掛本身雖是走向最終融入新聞編輯器之前的一個測試產品,但「志明編輯助手」其實沒有很多人使用XD。可以說是大家還不習慣,但大概還是歸咎於自己開發的功能還不夠「好用」(雖然已用力嘗試讓它不只是「一個工具」),這是未來自己還需要多多琢磨之處。

下圖供參考,UI 就是我與 Cursor (AI編輯器) 奮鬥的結果XD。

後來志明 AI 因應 LINE Notify 服務即將關閉,把輿情的通報等內容融合進外掛當中。同事將資料放到資料庫上,讓外掛去直接讀取近數個小時內的資料。

後來志明 AI 因應 LINE Notify 服務即將關閉,把輿情的通報等內容融合進外掛當中。同事將資料放到資料庫上,讓外掛去直接讀取近數個小時內的資料。


至於畫面左手邊的「熱門關鍵字」也是近期自己的工作主責之一。過去中央社已經非常早就將 CKIP 的斷詞技術應用在社稿當中,而這次我們也用了其他付費廠商的斷詞服務,為了達成相同目的,自己大概也花了數個月在奮鬥調整程式。

因為過去沒有這類型開發經驗,也在持續摸索這些從無到有的「產品」開發流程。

比如剛進去被分配到要處理 AI 圖片搜尋,跟曾待在AI新創的朋友聊到,「做RAG(Retrieval-Augmented Generation),大概處理最多的是那個R的部分」,感謝過去對新聞文字與新聞工作的敏感與對軟體工具開發的思維,也讓我更能思考人機如何更良善、無縫的互動。

先將圖片內容讓 AI 文字化、再將文字 embedding 後存入資料庫。使用者 Query 會與資料庫的資料做 similarity search 而獲取最終結果。

先將圖片內容讓 AI 文字化、再將文字 embedding 後存入資料庫。使用者 Query 會與資料庫的資料做 similarity search 而獲取最終結果。

此外,在之間的插曲是以球迷身份做了棒球12強速球的專題,這也是在板上分享過的部分了。參與了一點點數據分析,算是一圓資料記者夢XD。媒體實驗室仍留有製作內容的同事,總是感到驚嘆的是集3D、新聞專業於一身,一手撐起這好幾個很棒很棒的專題。



===

小插曲是,工作短短這段時間,陸陸續續還收到了幾個我自己非常非常喜歡的工作機會,但也因為總覺得想在目前的地方多學點東西而拒絕(然後每次拒絕都會惋惜萬分),由衷感謝身邊的機緣。我想未來還是會有機會的吧!


簡單記錄近況,不知道能走多遠,但就持續前行看看。





avatar-img
CT
68會員
78內容數
加入沙龍追蹤 CT 更多文章!
留言
avatar-img
留言分享你的想法!
CT 的其他內容
感謝永續報導獎,平面組個資外洩報導跟融媒體南山公墓網頁專題,最終後者獲得優等肯定。雖然就視覺上,我對自己能完整為載具(手機版、電腦版)閱讀新聞雖滿意,但當然也有很多值得思考之處。
在高中繁星撕榜的當下,從未想過會是此時此刻的現在;在撕下「交大三類」的貼紙,從未想過自己會在新竹這座城市生活,一待就是五年。 還記得剛入學的自己,老實說甚至還不知道自己念的科系是什麼(只知道就是唸生物)、有什麼資源。
如果你在任何地方看到六角學院新的一年又開啟了新的 Vue 直播班,且你跟我一樣還是一個非資工背景學生、一樣很害羞常常不敢公開問(程式)問題、但不確定是否跳坑一同學習的話,這篇文章很適合你。
感謝永續報導獎,平面組個資外洩報導跟融媒體南山公墓網頁專題,最終後者獲得優等肯定。雖然就視覺上,我對自己能完整為載具(手機版、電腦版)閱讀新聞雖滿意,但當然也有很多值得思考之處。
在高中繁星撕榜的當下,從未想過會是此時此刻的現在;在撕下「交大三類」的貼紙,從未想過自己會在新竹這座城市生活,一待就是五年。 還記得剛入學的自己,老實說甚至還不知道自己念的科系是什麼(只知道就是唸生物)、有什麼資源。
如果你在任何地方看到六角學院新的一年又開啟了新的 Vue 直播班,且你跟我一樣還是一個非資工背景學生、一樣很害羞常常不敢公開問(程式)問題、但不確定是否跳坑一同學習的話,這篇文章很適合你。