SageMaker是什麼?好用嗎?

更新於 發佈於 閱讀時間約 4 分鐘

一.引言

  先前在中國的工作環境相對封閉,並沒有使用雲端產品進行AI訓練及部屬,只有在本機端進行建置調試,但如今回到台灣了,該是時候接觸一下這些雲端的 AI 服務,而在 AWS 中,深度學習相關的服務鈴瑯滿目,但聽到有人提到 SageMaker ,這次就來看看它是個什麼樣的服務吧。

二.SagaMaker 說明

  Amazon SageMaker 是 AWS 上的機器學習服務,旨在簡化機器學習開發和部署的過程。這項服務通常被認為是易於使用且功能強大,特別適合於多種應用場景:

  1. 全方位服務:SageMaker 支持完整的機器學習流程,從數據準備、模型訓練到部署和監控,提供開箱即用的功能。
  2. 預先配置的環境:可以輕鬆啟動和管理預先配置的 Jupyter Notebook 實例,方便模型開發。
  3. 自動化:自動調參、模型訓練和部署等功能可以減少人工干預,提升效率。
  4. 擴展性:它與 AWS 其他服務無縫集成,支持分布式訓練和自定義算法,易於擴展至不同的計算環境。
  5. 靈活性:支持多種框架,如 TensorFlow、PyTorch 和 MXNet,並允許使用自定義容器運行其他機器學習框架。

  雖然 SageMaker 有很多優點,但可能需要考慮成本問題,以及它的學習曲線。如果你已經熟悉 AWS 生態系統,並且在尋找可以高度自定義的工具,那麼它是很值得考慮的選擇。

三.SageMaker 使用體驗

  詳細的介紹 AWS 上可說是相當完整,我就不再冗言,本篇文章以這篇示例進行實驗,這邊就以我的角度來說說, SageMaker 為我帶來甚麼樣的體驗。
  如同上個段落中說明的,"雖然 SageMaker 有很多優點,但可能需要考慮成本問題,以及需要一定程度上的熟悉 AWS 生態系統",這句話可以說是我這次的體驗總結,為什麼呢?讓我娓娓道來。

  首先環境配置部分,對於環境初始的配置有自動配置的引導,所以沒有遇到問題,不過若是多人共同使用,就要針對每個使用者新建可對應的腳色並分配權限等等,就會相對複雜,再來新建 Notebook 空間及 Jupyter 空間,到這一步就會出現一個問題,在新建 Notebook 實例時便會詢問要新建怎樣的實例,這邊預設為 ml.t3.medium ,但這個實例類型該如何選擇就得根據你的應用去調整,以本次的案例來說,是使用 sagemaker.pytorch 將訓練任務交給指定的 Docker 映像,所以這個 Notebook 實例不用使用等級太高的實例(各種定價可見相關頁面)。

  這裡給一個簡單判斷,一個 ml.t3.medium 提供 2 個虛擬 CPU 和 4 GB 的記憶體,大概可以處理數據集大小在幾百 MB 至數 GB 範圍內的 logistic regression 或小型神經網絡的訓練通常可以在合理時間內完成。

  再來是訓練流程的部分,程式碼大致上與不使用 SageMaker 類似,主要差別就是從本機端硬碟存取換成了從 S3 內存取, 以及訓練時改成以 sagemaker.pytorch 將編寫好的 Train.py 交給指定的映像去訓練,由此可知,若是要將本在本機的程式嗎移植到雲上,銜接上只需要小改即可。

  所以實際體驗下來,SageMaker好用嗎?我想若是你有很多服務都在上面,你需要你的模型與其他 AWS 服務互動,SageMaker確實提供了一個便捷的解決方案,會讓人頭疼的反而是這些 AWS 生態系統中定義的這些名詞及行為,官網中很多名詞隨意拋出,常常搞不太清楚到底要幹嘛,但這就是我尚未熟悉AWS 生態系統的表現,期待再幾篇文章後,我能好好搞清這些東西,再與各位分享分享。

estimator = PyTorch(
entry_point="mnist.py",
role=role,
py_version="py38",
framework_version="1.11.0",
instance_count=2,
instance_type="ml.c5.2xlarge",
hyperparameters={"epochs": 1, "backend": "gloo"},
)
estimator.fit({"training": inputs})

四.結語

  本次照著示例體驗了MNIST手寫辨識的案例,但其示例在很多部分都進行了簡化,所以體驗是順暢的,但很多實際會遇到的問題卻體驗不到,所以下篇打算實際移植先前實作的風格轉換上去呈現更符合實際應用的體驗成果。


avatar-img
8會員
21內容數
AI、電腦視覺、圖像處理、AWS等等持續學習時的學習筆記,也包含一些心得,主要是幫助自己學習,若能同時幫助到不小心來到這裡的人,那也是好事一件 : )
留言0
查看全部
avatar-img
發表第一個留言支持創作者!
貓貓學習筆記 的其他內容
實踐AWS中使用Lambda來負責登入簽核及與OpenAI API溝通,並利用S3容器託管一個靜態網頁做為前端
實踐AWS中使用Lambda來負責登入簽核及與OpenAI API溝通,並利用S3容器託管一個靜態網頁做為前端
你可能也想看
Google News 追蹤
Thumbnail
現代社會跟以前不同了,人人都有一支手機,只要打開就可以獲得各種資訊。過去想要辦卡或是開戶就要跑一趟銀行,然而如今科技快速發展之下,金融App無聲無息地進到你生活中。但同樣的,每一家銀行都有自己的App時,我們又該如何選擇呢?(本文係由國泰世華銀行邀約) 今天我會用不同角度帶大家看這款國泰世華CUB
Thumbnail
嘿,大家新年快樂~ 新年大家都在做什麼呢? 跨年夜的我趕工製作某個外包設計案,在工作告一段落時趕上倒數。 然後和兩個小孩過了一個忙亂的元旦。在深夜時刻,看到朋友傳來的解籤網站,興致勃勃熬夜體驗了一下,覺得非常好玩,或許有人玩過了,但還是想寫上來分享紀錄一下~
Thumbnail
本文介紹了人工智慧(AI)及機器學習(ML)的基本概念和關係,探討了數據在機器學習中的重要性,以及深度學習和生成式人工智慧的應用。
隨著全球數位化浪潮的推進,企業正面臨著前所未有的挑戰和機遇。數位轉型已成為企業保持競爭力的關鍵策略。在這個過程中,平台即服務(PaaS)作為一種強大的雲端解決方案,正在扮演著不可或缺的角色。本文將探討PaaS在數位轉型中的重要作用,並說明其如何幫助企業實現數位化目標。 簡化開發與部署 Paa
Thumbnail
在現今以及未來的工作中,AI 技能將扮演關鍵角色。為了滿足這一需求,許多頂尖科技公司和大學提供了免費的線上 AI 課程,讓有興趣進修、提升能力的讀者可以選擇適合自己的課程。
Thumbnail
你對 AI 的認識有多少?你在生活或工作上有運用哪些 AI 的應用服務嗎?一起來了解這個目前很夯的議題。 根據 google 對 AI(artificial intelligence,縮寫為AI)的解釋:AI 是人工智慧,定義是打造電腦與機器的科學領域,可以進行推論、學習以及採取行動。這些過往需要
Thumbnail
最新的AI趨勢讓人眼花撩亂,不知要如何開始學習?本文介紹了作者對AI的使用和體驗,以及各類AI工具以及推薦的選擇。最後強調了AI是一個很好用的工具,可以幫助人們節省時間並提高效率。鼓勵人們保持好奇心,不停止學習,並提出了對健康生活和開心生活的祝福。
Thumbnail
AIGC,全名是人工智能生成內容(AI-generated content),指的是使用人工智能技術自動生成的各種數字內容。這些內容可以包括文本、圖像、音樂、視頻、程式碼等等。AIGC利用自然語言處理(NLP)、計算機視覺、機器學習和深度學習等技術來創建和生成這些內容。
Thumbnail
Echobase的AI段落生成器是一個尖端的工具,旨在革新您創建內容的方式。這個強大的、免費使用的生成器利用先進的人工智能來製作引人注目的、SEO優化的段落,簡化您的寫作過程,提高您作品的質量。
Thumbnail
這篇文章介紹瞭如何利用生成式AI(GenAI)來提高學習效率,包括文章重點整理、完善知識體系、客製化學習回饋、提供多元觀點等方法。同時提醒使用者應注意內容的信效度,保持學術誠信,適當運用GenAI能大幅提升工作效率。
Thumbnail
生成式人工智慧(AI)已成為當前科技領域的一大熱點,其能力不僅限於模擬人類智能,更能在多種非傳統計算任務中創造前所未有的內容。這篇文章將深入探討生成式AI的理論基礎、實際應用、代碼實踐,以及其商業應用、工具和公司等方面,提供一個全面的視角來了解這一迅速發展的領域。
Thumbnail
在人工智慧(AI)領域中,生成式AI已經成為一個備受關注的分支,它不僅在創造性的工作中展現出強大的能力,還在各個領域中展現出潛在的應用價值。本文將從宏觀的角度出發,深入探討生成式AI的種類、概念、缺點、公司、訓練、發展趨勢以及原理,帶領讀者深入了解這個令人振奮的領域。
Thumbnail
現代社會跟以前不同了,人人都有一支手機,只要打開就可以獲得各種資訊。過去想要辦卡或是開戶就要跑一趟銀行,然而如今科技快速發展之下,金融App無聲無息地進到你生活中。但同樣的,每一家銀行都有自己的App時,我們又該如何選擇呢?(本文係由國泰世華銀行邀約) 今天我會用不同角度帶大家看這款國泰世華CUB
Thumbnail
嘿,大家新年快樂~ 新年大家都在做什麼呢? 跨年夜的我趕工製作某個外包設計案,在工作告一段落時趕上倒數。 然後和兩個小孩過了一個忙亂的元旦。在深夜時刻,看到朋友傳來的解籤網站,興致勃勃熬夜體驗了一下,覺得非常好玩,或許有人玩過了,但還是想寫上來分享紀錄一下~
Thumbnail
本文介紹了人工智慧(AI)及機器學習(ML)的基本概念和關係,探討了數據在機器學習中的重要性,以及深度學習和生成式人工智慧的應用。
隨著全球數位化浪潮的推進,企業正面臨著前所未有的挑戰和機遇。數位轉型已成為企業保持競爭力的關鍵策略。在這個過程中,平台即服務(PaaS)作為一種強大的雲端解決方案,正在扮演著不可或缺的角色。本文將探討PaaS在數位轉型中的重要作用,並說明其如何幫助企業實現數位化目標。 簡化開發與部署 Paa
Thumbnail
在現今以及未來的工作中,AI 技能將扮演關鍵角色。為了滿足這一需求,許多頂尖科技公司和大學提供了免費的線上 AI 課程,讓有興趣進修、提升能力的讀者可以選擇適合自己的課程。
Thumbnail
你對 AI 的認識有多少?你在生活或工作上有運用哪些 AI 的應用服務嗎?一起來了解這個目前很夯的議題。 根據 google 對 AI(artificial intelligence,縮寫為AI)的解釋:AI 是人工智慧,定義是打造電腦與機器的科學領域,可以進行推論、學習以及採取行動。這些過往需要
Thumbnail
最新的AI趨勢讓人眼花撩亂,不知要如何開始學習?本文介紹了作者對AI的使用和體驗,以及各類AI工具以及推薦的選擇。最後強調了AI是一個很好用的工具,可以幫助人們節省時間並提高效率。鼓勵人們保持好奇心,不停止學習,並提出了對健康生活和開心生活的祝福。
Thumbnail
AIGC,全名是人工智能生成內容(AI-generated content),指的是使用人工智能技術自動生成的各種數字內容。這些內容可以包括文本、圖像、音樂、視頻、程式碼等等。AIGC利用自然語言處理(NLP)、計算機視覺、機器學習和深度學習等技術來創建和生成這些內容。
Thumbnail
Echobase的AI段落生成器是一個尖端的工具,旨在革新您創建內容的方式。這個強大的、免費使用的生成器利用先進的人工智能來製作引人注目的、SEO優化的段落,簡化您的寫作過程,提高您作品的質量。
Thumbnail
這篇文章介紹瞭如何利用生成式AI(GenAI)來提高學習效率,包括文章重點整理、完善知識體系、客製化學習回饋、提供多元觀點等方法。同時提醒使用者應注意內容的信效度,保持學術誠信,適當運用GenAI能大幅提升工作效率。
Thumbnail
生成式人工智慧(AI)已成為當前科技領域的一大熱點,其能力不僅限於模擬人類智能,更能在多種非傳統計算任務中創造前所未有的內容。這篇文章將深入探討生成式AI的理論基礎、實際應用、代碼實踐,以及其商業應用、工具和公司等方面,提供一個全面的視角來了解這一迅速發展的領域。
Thumbnail
在人工智慧(AI)領域中,生成式AI已經成為一個備受關注的分支,它不僅在創造性的工作中展現出強大的能力,還在各個領域中展現出潛在的應用價值。本文將從宏觀的角度出發,深入探討生成式AI的種類、概念、缺點、公司、訓練、發展趨勢以及原理,帶領讀者深入了解這個令人振奮的領域。