【技術嘗試 Try Technique】嘗試 Meta 開源工具 Nougat:把學術文章轉 MultiMarkdown

閱讀時間約 1 分鐘
有沒有遇過想打開文獻 PDF 想進行複製卻複製出很奇怪的格式的時候?
比較喜歡 Markdown、LaTex 不喜歡 PDF?
那你或許會喜歡 Meta 新開源的工具:Nougat

PS. 這篇不會介紹背後技術,僅嘗試安裝與嘗試的過程

個人對看 Paper 用 PDF 其實又愛又恨。愛在方便不同裝置閱讀,尤其可以在 iPad 上做筆記。但是對於一些格式真是很討厭,例如文字排版複製下來會亂掉(雖然本來就不能亂複製,但我節錄做統整筆記的習慣就很不方便),還有 Table 只能用截圖、數學公式不好複製等等。所以我個人其實比較喜歡 Markdown 或 LaTex 這種格式,我還能自己編輯、補充東西上去給自己看。於是看到 Meta 開源一個新工具「Nougat」就很想試試看。另外想說既然開部落格了,順便以後就也記錄一下嘗試新東西的過程,也能當踩坑紀錄(?)


想繼續觀看文章嗎?歡迎到這裡收看:【技術嘗試 Try Technique】嘗試 Meta 開源工具 Nougat:把學術文章(PDF、HTML) 轉 Mathpix Markdown(.mmd)
以下也附上本文大綱,各位也可以直接跳到有興趣的地方查看!





avatar-img
1會員
8內容數
深入探索量化交易的世界。本系列教學涵蓋從基礎理論到實際策略的全面指南,使用 Python 和其他工具,助你成為成功的量化交易員。
留言0
查看全部
avatar-img
發表第一個留言支持創作者!
GQ 的小豬的沙龍 的其他內容
最近一個朋友問我:「有時候是真的不想接這麼多工作,可是又覺得不接就沒機會了,你會這樣覺得嗎?」我說:「以前會,後來吃到大虧就學乖了。」「選擇比努力更重要」這絕對不是一句廢話,但可能句是年少輕狂時不懂的話。 因為有學生身分的緣故,從大學開始很長的時間以來我都是兼職接案子做。一開始以為這樣的工作
介紹均線從數學上的本質、均線的種類,以及均線的延伸常見技術指標。另外會附上 Python 的實現算法(著重 SMA & EMA)。但不會介紹使用策略。 「取平均」是做統計分析裡面非常基礎、很早學到、常用的做法,而均線(Moving Average)也是技術指標當中最常被當第一個學習的指標。
介紹條件控制流程,包含組成它的比較運算子、條件運算式、條件語句。 繼講解完邏輯運算之後,我們終於要開始認識控制流程的其中之一:條件(Condition)。 如同在程式的邏輯思維中介紹到的,我們需要決定問題為 True 需要執行什麼,反之又要執行什麼。這些路徑的選擇便是由條件控制流程所實現。
介紹邏輯運算的觀念,包含布林值、運算子與運算式的介紹。並說明如何使用 Python 撰寫這些觀念。
介紹兩種思維模式,以及寫程式所需的思維能力與鍛鍊方法。 許多人覺得寫程式很難,依照個人教學經驗來看,多數是沒有先建立起寫程式的邏輯思維。一堆課程也是直接教你程式語法,好一點的會用實際案例帶你學習寫程式(有注重到應用面),但常常會忽略提及邏輯的重要性。
最近一個朋友問我:「有時候是真的不想接這麼多工作,可是又覺得不接就沒機會了,你會這樣覺得嗎?」我說:「以前會,後來吃到大虧就學乖了。」「選擇比努力更重要」這絕對不是一句廢話,但可能句是年少輕狂時不懂的話。 因為有學生身分的緣故,從大學開始很長的時間以來我都是兼職接案子做。一開始以為這樣的工作
介紹均線從數學上的本質、均線的種類,以及均線的延伸常見技術指標。另外會附上 Python 的實現算法(著重 SMA & EMA)。但不會介紹使用策略。 「取平均」是做統計分析裡面非常基礎、很早學到、常用的做法,而均線(Moving Average)也是技術指標當中最常被當第一個學習的指標。
介紹條件控制流程,包含組成它的比較運算子、條件運算式、條件語句。 繼講解完邏輯運算之後,我們終於要開始認識控制流程的其中之一:條件(Condition)。 如同在程式的邏輯思維中介紹到的,我們需要決定問題為 True 需要執行什麼,反之又要執行什麼。這些路徑的選擇便是由條件控制流程所實現。
介紹邏輯運算的觀念,包含布林值、運算子與運算式的介紹。並說明如何使用 Python 撰寫這些觀念。
介紹兩種思維模式,以及寫程式所需的思維能力與鍛鍊方法。 許多人覺得寫程式很難,依照個人教學經驗來看,多數是沒有先建立起寫程式的邏輯思維。一堆課程也是直接教你程式語法,好一點的會用實際案例帶你學習寫程式(有注重到應用面),但常常會忽略提及邏輯的重要性。
你可能也想看
Google News 追蹤
Thumbnail
這篇文章闡述瞭如何將MDX(多維表達式)文件轉換為PDF,包括執行MDX查詢,導出結果,格式化數據以及最後的轉換過程。同時介紹了專業工具PDFtoPDF.ai的使用方法和好處。這篇指南將幫助您有效地完成MDX文件到PDF的轉換,為報告、分析或展示做好準備。
Thumbnail
市面上有許多出色的PDF編輯器替代方案,如Foxit PhantomPDF、Nitro Pro、PDF-XChange Editor等。這些編輯器功能強大,用戶界面友好,並可在特定需求上表現更優秀。如果您需要高精度OCR和文檔管理功能,PDFtoPDF.ai是不錯的選擇。
Thumbnail
這篇文章介紹如何使用VBA程式碼將【包含備註】的Excel檔案轉換為PDF檔。在研究這個問題時,作者花了3個小時多的時間,但後來發現了一個更簡單的方法,這讓作者感到震驚和懷疑人生。最後,作者強調使用他人的智慧來提高自己的能力。文章提供了相關參考文獻和圖片。
在日常工作和學習中,PDF檔案是一種常見的文件格式。然而,許多使用者發現,要完全使用PDF的各種功能,如PDF旋轉、PDF刪除頁面、PDF加密、PDF解除加密、PDF浮水印和PDF轉txt,都需要購買升級版的軟體。
Thumbnail
這篇文章介紹了三種將 PDF 轉換為 Word 的方法,包括使用 Microsoft Word、在線轉換工具和 Adobe Acrobat DC。此外,文章提供了保存檔案、常見問題解答等相關提示。
Thumbnail
在信息化時代,PDF文件無處不在。無論是學術研究、商業文件還是個人檔案,PDF都已成為最常見的文檔格式。然而,許多PDF文件是通過掃描紙質文檔生成的,這些文件中的文字無法直接編輯或複製。借助先進的OCR技術,使用者可以將掃描的PDF轉換為可搜索的文本,提升工作和學習效率。
Thumbnail
在當今數字化時代,需求日益增長。本文詳細介紹了幾種常用的PDF轉Word方法,並討論了它們的侷限性。接下來,我們將向您介紹pdftopdf.ai,一款具有先進的OCR和LLM技術,提供高效且保持原始文件格式和質量的解決方案。
Thumbnail
在數位辦公環境中,PDF文件是日常工作不可或缺的一部分。pdftopdf.ai是一款強大的PDF編輯工具,可以壓縮文件,讓PDF文件更易編輯和管理。本文將探討PDF編輯工具的功能、優勢及在不同場景中的應用。
Thumbnail
全新軟體PDFtoPDF.ai使用先進的PDF壓縮技術,將笨重的PDF圖像轉換為易於管理的可編輯文字,同時保持文件質量。使用PDFtoPDF.ai,專業人士和個人用戶能輕鬆管理大量文件,提高工作效率。
Thumbnail
分享了作者個人的經驗和使用的工具。從2012年開始將紙本筆記做成電子檔,首先使用Evernote,後來還加入了Goodnotes和Notion的行列。簡單分享選擇和使用不同工具的原因,對於需要將紙本筆記電子化的朋友,可以看一眼哦!
Thumbnail
這篇文章闡述瞭如何將MDX(多維表達式)文件轉換為PDF,包括執行MDX查詢,導出結果,格式化數據以及最後的轉換過程。同時介紹了專業工具PDFtoPDF.ai的使用方法和好處。這篇指南將幫助您有效地完成MDX文件到PDF的轉換,為報告、分析或展示做好準備。
Thumbnail
市面上有許多出色的PDF編輯器替代方案,如Foxit PhantomPDF、Nitro Pro、PDF-XChange Editor等。這些編輯器功能強大,用戶界面友好,並可在特定需求上表現更優秀。如果您需要高精度OCR和文檔管理功能,PDFtoPDF.ai是不錯的選擇。
Thumbnail
這篇文章介紹如何使用VBA程式碼將【包含備註】的Excel檔案轉換為PDF檔。在研究這個問題時,作者花了3個小時多的時間,但後來發現了一個更簡單的方法,這讓作者感到震驚和懷疑人生。最後,作者強調使用他人的智慧來提高自己的能力。文章提供了相關參考文獻和圖片。
在日常工作和學習中,PDF檔案是一種常見的文件格式。然而,許多使用者發現,要完全使用PDF的各種功能,如PDF旋轉、PDF刪除頁面、PDF加密、PDF解除加密、PDF浮水印和PDF轉txt,都需要購買升級版的軟體。
Thumbnail
這篇文章介紹了三種將 PDF 轉換為 Word 的方法,包括使用 Microsoft Word、在線轉換工具和 Adobe Acrobat DC。此外,文章提供了保存檔案、常見問題解答等相關提示。
Thumbnail
在信息化時代,PDF文件無處不在。無論是學術研究、商業文件還是個人檔案,PDF都已成為最常見的文檔格式。然而,許多PDF文件是通過掃描紙質文檔生成的,這些文件中的文字無法直接編輯或複製。借助先進的OCR技術,使用者可以將掃描的PDF轉換為可搜索的文本,提升工作和學習效率。
Thumbnail
在當今數字化時代,需求日益增長。本文詳細介紹了幾種常用的PDF轉Word方法,並討論了它們的侷限性。接下來,我們將向您介紹pdftopdf.ai,一款具有先進的OCR和LLM技術,提供高效且保持原始文件格式和質量的解決方案。
Thumbnail
在數位辦公環境中,PDF文件是日常工作不可或缺的一部分。pdftopdf.ai是一款強大的PDF編輯工具,可以壓縮文件,讓PDF文件更易編輯和管理。本文將探討PDF編輯工具的功能、優勢及在不同場景中的應用。
Thumbnail
全新軟體PDFtoPDF.ai使用先進的PDF壓縮技術,將笨重的PDF圖像轉換為易於管理的可編輯文字,同時保持文件質量。使用PDFtoPDF.ai,專業人士和個人用戶能輕鬆管理大量文件,提高工作效率。
Thumbnail
分享了作者個人的經驗和使用的工具。從2012年開始將紙本筆記做成電子檔,首先使用Evernote,後來還加入了Goodnotes和Notion的行列。簡單分享選擇和使用不同工具的原因,對於需要將紙本筆記電子化的朋友,可以看一眼哦!