AI Booster - Scale AI (2)

更新於 發佈於 閱讀時間約 3 分鐘

Our mission is to accelerate the development of AI applications

raw-image

這系列文章是透過蒐集、分享我覺得有意思AI服務、相關文章、影片,期許自己能更了解這世界上正在發生什麼。

上一篇初步介紹了Scale 的願景和實現願景的第一步-資料標註後,本篇繼續來討論Scale AI的產品和產業應用。



Scale Rapid

Scale Rapid 是Scale打造高效量產標註的主力平台之一,協助用戶從原本需花數日到數月的資料標註工作縮短至數小時內。用戶可以在Scale Rapid上傳自己的資料集選擇使用案例(Use case)建立分類標準法則提供標註的指令說明等調校後,即可批量標註

Image credit: Scale AI

Image credit: Scale AI

用戶可以上傳資料格式豐富,包含從本機端上傳檔案、csv、AWS S3、Google雲端硬碟、微軟Azure等。用戶可以使用 Task Interface Customization 工具來處理上傳的csv檔案。

Task Interface Customization (Image credit: Scale AI)

Task Interface Customization (Image credit: Scale AI)

根據不同種類的資料屬性,Scale提供多種使用案例。比如文字屬性的資料,使用案例包括內容分類(Content Classification)、文字生成(Text Generation)、內容蒐集(Content Collection)等;圖片屬性的資料使用案例包括物件偵測(Object Detection)、語意分割(Semantic Segmentation)、實體抽取(Entity Extraction)等。

Content Classification & Collection (Image credit: Scale AI)Entity Extraction (Image credit: Scale AI)

Scale提供用戶視覺化編譯器和JSON編譯器處理分類標準法則並提供高度客製化的選項,比如針對標籤盒的大小、長寬設置上下限等。

Taxonomy (Image credit: Scale AI)

Taxonomy (Image credit: Scale AI)

Taxonomy (Image credit: Scale AI)

Taxonomy (Image credit: Scale AI)


Scale Studio

如果用戶擁有標註團隊欲自行標註資料,用戶可以在Scale Studio管理專案。在此平台中,團隊能在此協作,所有活動日誌都會被記錄下來,管理層也能在此評估比較團隊的績效。

Scale Studio (Image credit: Scale AI)

Scale Studio (Image credit: Scale AI)


Activity Log (Image credit: Scale AI)

Activity Log (Image credit: Scale AI)

在Scale Studio中,用戶能使用Scale開發的工具比如自動標註工具(Auto-Annotate Tool),這工具類似Photoshop幫助用戶找到圖片裡物品的邊界並協助將其標註。

Auto-Annotate Tool (Image credit: Scale AI)

Auto-Annotate Tool (Image credit: Scale AI)


Scale Studio中的標註專案也可以整合至Scale Rapid,讓Scale接手標註工作。

Studio -> Rapid (Image credit: Scale AI)

Studio -> Rapid (Image credit: Scale AI)



越寫覺得Scale AI是一個相當完整的生態系,網站裡也有很多寶藏。下一篇我們會來繼續討論Scale AI的產品如Scale InstantML、Scale Map、Scale Spellbook。

Thank you!



Informula 致力於提升工作生產力,分享生產力工具使用情境、簡單的程式、資料處理、數據分析、網路爬蟲應用等。 尋求長期的自我成長要求或職場臨時急救包的朋友歡迎一起交流。
留言0
查看全部
avatar-img
發表第一個留言支持創作者!
Better Data. Better AI. Faster AI. Scale AI 是一家2016年成立的科技公司,其願景是加速人工智慧和機器學習於各大產業的應用。在導入機器學習
Better Data. Better AI. Faster AI. Scale AI 是一家2016年成立的科技公司,其願景是加速人工智慧和機器學習於各大產業的應用。在導入機器學習
你可能也想看
Google News 追蹤
Thumbnail
大家好,我是woody,是一名料理創作者,非常努力地在嘗試將複雜的料理簡單化,讓大家也可以體驗到料理的樂趣而我也非常享受料理的過程,今天想跟大家聊聊,除了料理本身,料理創作背後的成本。
Thumbnail
哈囉~很久沒跟各位自我介紹一下了~ 大家好~我是爺恩 我是一名圖文插畫家,有追蹤我一段時間的應該有發現爺恩這個品牌經營了好像.....快五年了(汗)時間過得真快!隨著時間過去,創作這件事好像變得更忙碌了,也很開心跟很多厲害的創作者以及廠商互相合作幫忙,還有最重要的是大家的支持與陪伴🥹。  
Thumbnail
嘿,大家新年快樂~ 新年大家都在做什麼呢? 跨年夜的我趕工製作某個外包設計案,在工作告一段落時趕上倒數。 然後和兩個小孩過了一個忙亂的元旦。在深夜時刻,看到朋友傳來的解籤網站,興致勃勃熬夜體驗了一下,覺得非常好玩,或許有人玩過了,但還是想寫上來分享紀錄一下~
Thumbnail
Hi 我是 VK~ 很常會看到 Scale AI 的消息,粗淺知道他們是在做資料標記(Data Labeling,或稱數據標記)。近來也有討論說資料會先用完,還是算力。剛好趁著這個機會深入了解 Scale AI 在做些什麼,他們如何解決資料標記的問題,以及在這領域中還有哪些玩家。 這期來聊聊 S
Thumbnail
在當今快速變化的數位時代,企業面臨著前所未有的數據處理需求。為了應對這些挑戰,企業紛紛建立自己的大型語言模型(LLM),利用大量數據進行訓練,讓模型能夠理解並生成自然語言,從而實現人機協作,優化業務流程並提升客戶體驗。
我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 延續 AI說書 - 從0開始 - 103 所載入的資料集,現在要來進行資料前置處理,首先載入需要的依賴: import pickle from pickle impo
隨著全球數位化浪潮的推進,企業正面臨著前所未有的挑戰和機遇。數位轉型已成為企業保持競爭力的關鍵策略。在這個過程中,平台即服務(PaaS)作為一種強大的雲端解決方案,正在扮演著不可或缺的角色。本文將探討PaaS在數位轉型中的重要作用,並說明其如何幫助企業實現數位化目標。 簡化開發與部署 Paa
Thumbnail
本文要探討AI的任務與實戰場景。AI技術已深入生活各層面,從違約預測到都市交通管理。AI任務主要有三類:數值型資料處理、自然語言處理(NLP)和電腦影像辨識。時間序列資料和強化學習方法(如AlphaGo)也引起廣泛關注。AI演算法和方法因應不同學派和技術發展而多樣化,了解這些基礎有助選擇適合研究方向
Thumbnail
本文談及資料科學的領域與分工。首先是建造一個AI的研發流程,資料收集到 AI 模型訓練的過程,AI經歷這一切流程被創造出來並產生價值;再來本文也提及在這個領域中的各種腳色、資料工程師、數據庫工程師、資料科學家和資料分析師的各種介紹。並且強調跨領域合作的重要性。
Thumbnail
我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 我們在AI說書 - 從0開始 - 42中,見識了 Tokenizer 做的事情了,以下來羅列幾個要點: 它將原始文字轉成小寫 有可能將原始文字再進行切割 通常 T
機器學習領域的專業人士可以從這篇文章中獲得寶貴的見解。 追求更大的數據集和更強大的模型一直是提升性能的核心策略。 以下是我在機器學習領域工作7年後的三個重大體悟。 ▋體悟1 - 大數據的重要性 自2009年ImageNet問世以來, 數據集的規模和質量對機器學習的影響越
Thumbnail
Echobase的AI段落生成器是一個尖端的工具,旨在革新您創建內容的方式。這個強大的、免費使用的生成器利用先進的人工智能來製作引人注目的、SEO優化的段落,簡化您的寫作過程,提高您作品的質量。
Thumbnail
再之前的文章中有分享到Zerotier這套虛擬區網軟體,可以將不同網路下的裝置給連接起來達到,方便分享和傳輸。不過,對於Zerotier的設定一下要登入帳號、塡ID,一下又要到網頁後台授權認證,對於有些人來說難免會過於複雜。本篇要介紹的Tailscale可以很好的解決這個問題。
Thumbnail
大家好,我是woody,是一名料理創作者,非常努力地在嘗試將複雜的料理簡單化,讓大家也可以體驗到料理的樂趣而我也非常享受料理的過程,今天想跟大家聊聊,除了料理本身,料理創作背後的成本。
Thumbnail
哈囉~很久沒跟各位自我介紹一下了~ 大家好~我是爺恩 我是一名圖文插畫家,有追蹤我一段時間的應該有發現爺恩這個品牌經營了好像.....快五年了(汗)時間過得真快!隨著時間過去,創作這件事好像變得更忙碌了,也很開心跟很多厲害的創作者以及廠商互相合作幫忙,還有最重要的是大家的支持與陪伴🥹。  
Thumbnail
嘿,大家新年快樂~ 新年大家都在做什麼呢? 跨年夜的我趕工製作某個外包設計案,在工作告一段落時趕上倒數。 然後和兩個小孩過了一個忙亂的元旦。在深夜時刻,看到朋友傳來的解籤網站,興致勃勃熬夜體驗了一下,覺得非常好玩,或許有人玩過了,但還是想寫上來分享紀錄一下~
Thumbnail
Hi 我是 VK~ 很常會看到 Scale AI 的消息,粗淺知道他們是在做資料標記(Data Labeling,或稱數據標記)。近來也有討論說資料會先用完,還是算力。剛好趁著這個機會深入了解 Scale AI 在做些什麼,他們如何解決資料標記的問題,以及在這領域中還有哪些玩家。 這期來聊聊 S
Thumbnail
在當今快速變化的數位時代,企業面臨著前所未有的數據處理需求。為了應對這些挑戰,企業紛紛建立自己的大型語言模型(LLM),利用大量數據進行訓練,讓模型能夠理解並生成自然語言,從而實現人機協作,優化業務流程並提升客戶體驗。
我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 延續 AI說書 - 從0開始 - 103 所載入的資料集,現在要來進行資料前置處理,首先載入需要的依賴: import pickle from pickle impo
隨著全球數位化浪潮的推進,企業正面臨著前所未有的挑戰和機遇。數位轉型已成為企業保持競爭力的關鍵策略。在這個過程中,平台即服務(PaaS)作為一種強大的雲端解決方案,正在扮演著不可或缺的角色。本文將探討PaaS在數位轉型中的重要作用,並說明其如何幫助企業實現數位化目標。 簡化開發與部署 Paa
Thumbnail
本文要探討AI的任務與實戰場景。AI技術已深入生活各層面,從違約預測到都市交通管理。AI任務主要有三類:數值型資料處理、自然語言處理(NLP)和電腦影像辨識。時間序列資料和強化學習方法(如AlphaGo)也引起廣泛關注。AI演算法和方法因應不同學派和技術發展而多樣化,了解這些基礎有助選擇適合研究方向
Thumbnail
本文談及資料科學的領域與分工。首先是建造一個AI的研發流程,資料收集到 AI 模型訓練的過程,AI經歷這一切流程被創造出來並產生價值;再來本文也提及在這個領域中的各種腳色、資料工程師、數據庫工程師、資料科學家和資料分析師的各種介紹。並且強調跨領域合作的重要性。
Thumbnail
我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 我們在AI說書 - 從0開始 - 42中,見識了 Tokenizer 做的事情了,以下來羅列幾個要點: 它將原始文字轉成小寫 有可能將原始文字再進行切割 通常 T
機器學習領域的專業人士可以從這篇文章中獲得寶貴的見解。 追求更大的數據集和更強大的模型一直是提升性能的核心策略。 以下是我在機器學習領域工作7年後的三個重大體悟。 ▋體悟1 - 大數據的重要性 自2009年ImageNet問世以來, 數據集的規模和質量對機器學習的影響越
Thumbnail
Echobase的AI段落生成器是一個尖端的工具,旨在革新您創建內容的方式。這個強大的、免費使用的生成器利用先進的人工智能來製作引人注目的、SEO優化的段落,簡化您的寫作過程,提高您作品的質量。
Thumbnail
再之前的文章中有分享到Zerotier這套虛擬區網軟體,可以將不同網路下的裝置給連接起來達到,方便分享和傳輸。不過,對於Zerotier的設定一下要登入帳號、塡ID,一下又要到網頁後台授權認證,對於有些人來說難免會過於複雜。本篇要介紹的Tailscale可以很好的解決這個問題。