久違更新近況。
一直以來實在相當感謝機緣,雖然不總總在自己需要或想要的時刻來臨(過於奢侈),但感謝願意相信的長輩、朋友,給予諸多機會和關懷。比起大學至碩一以前發文頻繁,這兩年只有偶爾在臉書上更新(近期還都是棒球XD),這樣的頻率近期應該不會有太大的變動。2021年同時入學了生資所與新聞所、2022年生資碩士畢業。在2023年新聞所碩二結束後,想說不枉新聞所一場,實在是真的很想當記者(或更定義清楚可能偏向資料記者)看看,哪怕短期的實習記者,希望能伴隨碩三的研究生活,把握年輕、學生身份去嘗試,或能找到未來的明確動向。
必須說大學時期幾乎把時間奉獻給(相對比較基礎科學的)實驗室,真心很想去業界看看,曾經也投過幾個實習無果,而這次投了幾家心儀且崇拜的媒體團隊(天下、關鍵...),實習缺無果,正職缺對部分媒體來說仍有疑慮(在學身份,但其實已經努力辯護自己已經沒有課了)。
也算是做過夢了,決定先去當兵沉澱。
2023年11月服替代役至隔年5月,感謝北市原民會,遇到很好的鄰兵&同事、還算舒適的工作環境,算是體驗/觀察了半年的公務員(打雜)生活。

原民會打雜生活
結束服役生涯,很意外的在因緣際會下,七月進入了中央社媒體實驗室。

今年續約的公告(其實蠻酷的,竟然還會被貼出來XD)
過去大家(媒體圈)對媒體實驗室的印象大概都是持續推出很不錯的數位敘事專題,酒駕報導、水果戰士、議員提案專題...,很多都很有印象。但我進去的當下,媒體實驗室開始減少了專題產製,轉而做關於 AI 、NLP 結合應用在新聞編輯室,從專題團隊變成類似資訊 RD 團隊,雖然這樣的編制在媒體裡面大概極少見(或者感覺沒見過(?) ),畢竟如果有專業大量的需求,大概媒體會選擇外包居多(?)。但撇開無論是自我成長還是各項條件看,至今回想起來仍慶幸自己能參與其中。
身邊的朋友如果有聽說的話,過去曾經說過「好想在媒體業當一個工程師」這類話,至少在現階段竟然有點莫名的實現了。可以寫 code 之餘,聽聽daily、編輯台、專題的腦力激盪跟專題生成,就算自己沒參與(但很想參與XD)還是很快樂。
AI,對於理工人來說早就不是什麼新名詞。各種機器學習演算法早就已經充斥在每日課程中。生資背景來看,那些蛋白質結構預測,也都 AI 在裡面。所以比起講 AI,想要更限縮談的是「GAI(生成式 AI,Generative Artificial Intelligence)」。
這段時間中,世界發生了劇烈變化。ChatGPT 橫空出世,不僅衝擊文字工作者,更漸漸也衝擊了軟體開發者(甚至針對「半路出家」的軟體開發者)。聊天機器人本來就不是舊名詞,但能讓機器賦予思考、推理能力,做的「像人」、「幾乎就是人」,ChatGPT 出現是一個相當大的突破。
在媒體實驗室開始做的各項專案,除了思考 GAI 應用在 newsroom 的機會,GAI 也開始介入了自己的開發流程。
(不禁感嘆大學四年努力與血淚讓死腦筋學會的程式,這個時代開始寫程式的人只要用力一個月幾乎等於我的大學四年......)
跟AI合作開發了AI下標、AI配圖(AI-powered image/video search),與同事合作新聞事件摘要(私心很喜歡這部分),結合斷詞廠商與同事思考建立萃取關鍵字的機制。
此外,自己雖然會前端,但也從不會寫 Chrome Extension,因此這次也與AI合作做了「志明編輯助手」將這些「AI組合拳」統合為一,供編輯、記者使用。

最一開始志明助手版本
大概比起科技業,我們看來沒有特別嚴謹的產品開發的流程。這個外掛本身雖是走向最終融入新聞編輯器之前的一個測試產品,但「志明編輯助手」其實沒有很多人使用XD。可以說是大家還不習慣,但大概還是歸咎於自己開發的功能還不夠「好用」(雖然已用力嘗試讓它不只是「一個工具」),這是未來自己還需要多多琢磨之處。
下圖供參考,UI 就是我與 Cursor (AI編輯器) 奮鬥的結果XD。

後來志明 AI 因應 LINE Notify 服務即將關閉,把輿情的通報等內容融合進外掛當中。同事將資料放到資料庫上,讓外掛去直接讀取近數個小時內的資料。
至於畫面左手邊的「熱門關鍵字」也是近期自己的工作主責之一。過去中央社已經非常早就將 CKIP 的斷詞技術應用在社稿當中,而這次我們也用了其他付費廠商的斷詞服務,為了達成相同目的,自己大概也花了數個月在奮鬥調整程式。
因為過去沒有這類型開發經驗,也在持續摸索這些從無到有的「產品」開發流程。
比如剛進去被分配到要處理 AI 圖片搜尋,跟曾待在AI新創的朋友聊到,「做RAG(Retrieval-Augmented Generation),大概處理最多的是那個R的部分」,感謝過去對新聞文字與新聞工作的敏感與對軟體工具開發的思維,也讓我更能思考人機如何更良善、無縫的互動。

先將圖片內容讓 AI 文字化、再將文字 embedding 後存入資料庫。使用者 Query 會與資料庫的資料做 similarity search 而獲取最終結果。
此外,在之間的插曲是以球迷身份做了棒球12強速球的專題,這也是在板上分享過的部分了。參與了一點點數據分析,算是一圓資料記者夢XD。媒體實驗室仍留有製作內容的同事,總是感到驚嘆的是集3D、新聞專業於一身,一手撐起這好幾個很棒很棒的專題。
===
小插曲是,工作短短這段時間,陸陸續續還收到了幾個我自己非常非常喜歡的工作機會,但也因為總覺得想在目前的地方多學點東西而拒絕(然後每次拒絕都會惋惜萬分),由衷感謝身邊的機緣。我想未來還是會有機會的吧!
簡單記錄近況,不知道能走多遠,但就持續前行看看。