2024-10-25|閱讀時間 ‧ 約 5 分鐘

作為一個麻瓜,被懶散的ChatGPT氣到,乾脆直接叫他教我寫程式

    為了剪紀錄片,嘗試破解Premiere文本生成工具

    raw-image


    為了剪紀錄片,嘗試破解Premiere文本剪輯工具

    【動機】

    想要使用Premiere的文本剪輯功能,但是PR的中文辨識太不準確,希望使用Goodtape的辨識結果套入回去PR做文本剪輯。

    【思路】

    開始PR文本剪輯功能後,會先辨識文本,然後可以將結果輸出成.prtranscript或.txt,也可以反向匯入.prtranscript或是修正的.txt回去,在PR裡面做剪輯。但.prtranscript是Adobe開發的格式,沒有找到工具可以解讀裡面的內容,所以也無法模仿。因此選擇仿造.txt格式,再匯入回PR。


    Goodtape可以下載的檔案有兩種

    1. srt 也就是常見的字幕檔:包含順序、持續時間碼、台詞三個資訊


    1 00:01:18,430 --> 00:01:19,670 好像應該上底妝

    2 00:01:19,670 --> 00:01:20,470 可惡

    3 00:01:20,470 --> 00:01:21,770 底妝

    4 00:01:21,770 --> 00:01:23,770 對 我現在後悔沒上底妝


    1. txt:包含講者、開始時間碼、台詞三個資訊


    講者一 [01:18] 好像應該上底妝

    講者二 [01:19] 可惡 底妝

    講者三 [01:21] 對 我現在後悔沒上底妝 因為我氣色不好 應該都是 氣色不夠好怎麼辦

    要轉換成PR匯出的.txt:包含講者、持續時間碼、台詞三個資訊

    00;01;18;09 - 00;01;28;04 Speaker 1 好像一個上帝從水中走。我相信後面上帝造七色花。公司的氣色不夠好。

    00;01;28;05 - 00;01;29;01 Speaker 2 怎麼辦這可不是。

    00;01;29;02 - 00;01;30;20 Speaker 1 笑容。


    PS:明明是同一段,不知道PR在辨識什麼鬼


    >> 只要能把Goodtape匯出的兩個檔案,整理成PR匯出的.txt格式,理應可以再匯回PR使用

    【做法】

    原本我直接提供檔案給ChatGPT,請他幫忙整合,結果他處理到100行左右就停下來了。每次告訴他他沒做完,他就又多跑個10行就停下來,鼓勵或是罵都一樣的結果,但整個檔案有1000多行要處理。一氣之下,乾脆請他教我寫程式來跑算了!

    Prompt:我想要寫一個huggingface服務,會參考a檔案格式,將b跟c檔案整理成a檔案的格式 有兩個上傳位置,可以上傳b(srt)跟c(goodtape下載txt),跟一個下載整理好的txt檔案

    他整理好app.py的程式碼讓我佈署到huggingface上,後面就是持續的截圖錯誤訊息給他,他再給我更新程式碼的反覆流程,但到了某個程度後不管怎麼給她資訊結果都卡住,無法下載生成的檔案。麻瓜如果一點都看不懂裡面的內容,當然也無從除錯起。


    【如何解決】

    工程師室友回家了!

    他說GPT沒辦法處理一次這麼複雜的事情,要將所有步驟拆解,從最簡單的單位開始,先從確認讀到上傳的檔案開始,然後加入try-catch讓他能主動回報錯誤訊息,才有辦法讓他修正。


    接著我就先從上傳srt檔案開始

    prompt:請確保我可以上傳b檔案,並且這個檔案可以被huggingface讀取並預覽

    prompt:接下來基於前面的功能,加入可以預覽C檔案的程式碼,同時可以預覽兩個檔案的內容

    prompt:請幫我在預覽的地方分成兩個欄位 分別對應B跟C檔案

    prompt:接下來請將B跟C內容檔案整理成A檔案的格式,並可以讓A檔案以txt檔案方式下載,同時也有預覽的欄位,以下是A、B、C檔案

    prompt:成功運作了,但是輸出的內容並沒有包含,講者一、講者二這些資訊,顯示的是範例中的Speaker1、Speaker 2。我想要整理出來的檔案應該是包含c檔案的這些講者資訊(截圖)

    完成!

    【手術成功了,但病人死了】

    抱著初次成功使用魔法的喜悅,帶著.txt匯回PR,結果還是打不贏Adobe大魔王QQ

    原來PR文本剪輯功能裡面「持續時間碼」跟「講者」兩個資訊已經被固定,我匯回的.txt只能取代台詞的資訊,沒辦法取代「持續時間碼」跟「講者」,所以還是無法實現在PR裡面的文本剪輯功能。


    成功寫出來的小工具,也就成為了小廢物,放在這邊供大家賞玩

    https://huggingface.co/spaces/billynien/srt_converter

    以上就是麻瓜初次學魔法的歷程,總共耗時約一個晚上

    分享至
    成為作者繼續創作的動力吧!
    © 2024 vocus All rights reserved.