為了剪紀錄片,嘗試破解Premiere文本生成工具
為了剪紀錄片,嘗試破解Premiere文本剪輯工具
想要使用Premiere的文本剪輯功能,但是PR的中文辨識太不準確,希望使用Goodtape的辨識結果套入回去PR做文本剪輯。
開始PR文本剪輯功能後,會先辨識文本,然後可以將結果輸出成.prtranscript或.txt,也可以反向匯入.prtranscript或是修正的.txt回去,在PR裡面做剪輯。但.prtranscript是Adobe開發的格式,沒有找到工具可以解讀裡面的內容,所以也無法模仿。因此選擇仿造.txt格式,再匯入回PR。
Goodtape可以下載的檔案有兩種
1 00:01:18,430 --> 00:01:19,670 好像應該上底妝
2 00:01:19,670 --> 00:01:20,470 可惡
3 00:01:20,470 --> 00:01:21,770 底妝
4 00:01:21,770 --> 00:01:23,770 對 我現在後悔沒上底妝
講者一 [01:18] 好像應該上底妝
講者二 [01:19] 可惡 底妝
講者三 [01:21] 對 我現在後悔沒上底妝 因為我氣色不好 應該都是 氣色不夠好怎麼辦
要轉換成PR匯出的.txt:包含講者、持續時間碼、台詞三個資訊
00;01;18;09 - 00;01;28;04 Speaker 1 好像一個上帝從水中走。我相信後面上帝造七色花。公司的氣色不夠好。
00;01;28;05 - 00;01;29;01 Speaker 2 怎麼辦這可不是。
00;01;29;02 - 00;01;30;20 Speaker 1 笑容。
PS:明明是同一段,不知道PR在辨識什麼鬼
>> 只要能把Goodtape匯出的兩個檔案,整理成PR匯出的.txt格式,理應可以再匯回PR使用
原本我直接提供檔案給ChatGPT,請他幫忙整合,結果他處理到100行左右就停下來了。每次告訴他他沒做完,他就又多跑個10行就停下來,鼓勵或是罵都一樣的結果,但整個檔案有1000多行要處理。一氣之下,乾脆請他教我寫程式來跑算了!
Prompt:我想要寫一個huggingface服務,會參考a檔案格式,將b跟c檔案整理成a檔案的格式 有兩個上傳位置,可以上傳b(srt)跟c(goodtape下載txt),跟一個下載整理好的txt檔案
他整理好app.py的程式碼讓我佈署到huggingface上,後面就是持續的截圖錯誤訊息給他,他再給我更新程式碼的反覆流程,但到了某個程度後不管怎麼給她資訊結果都卡住,無法下載生成的檔案。麻瓜如果一點都看不懂裡面的內容,當然也無從除錯起。
工程師室友回家了!
他說GPT沒辦法處理一次這麼複雜的事情,要將所有步驟拆解,從最簡單的單位開始,先從確認讀到上傳的檔案開始,然後加入try-catch讓他能主動回報錯誤訊息,才有辦法讓他修正。
接著我就先從上傳srt檔案開始
prompt:請確保我可以上傳b檔案,並且這個檔案可以被huggingface讀取並預覽
prompt:接下來基於前面的功能,加入可以預覽C檔案的程式碼,同時可以預覽兩個檔案的內容
prompt:請幫我在預覽的地方分成兩個欄位 分別對應B跟C檔案
prompt:接下來請將B跟C內容檔案整理成A檔案的格式,並可以讓A檔案以txt檔案方式下載,同時也有預覽的欄位,以下是A、B、C檔案
prompt:成功運作了,但是輸出的內容並沒有包含,講者一、講者二這些資訊,顯示的是範例中的Speaker1、Speaker 2。我想要整理出來的檔案應該是包含c檔案的這些講者資訊(截圖)
完成!
抱著初次成功使用魔法的喜悅,帶著.txt匯回PR,結果還是打不贏Adobe大魔王QQ
原來PR文本剪輯功能裡面「持續時間碼」跟「講者」兩個資訊已經被固定,我匯回的.txt只能取代台詞的資訊,沒辦法取代「持續時間碼」跟「講者」,所以還是無法實現在PR裡面的文本剪輯功能。
成功寫出來的小工具,也就成為了小廢物,放在這邊供大家賞玩
https://huggingface.co/spaces/billynien/srt_converter
以上就是麻瓜初次學魔法的歷程,總共耗時約一個晚上