大數據下的技術演變 ❘ 焦點人物訪談 ❘ Kenny( IBM Consulting 大數據工程師)

閱讀時間約 5 分鐘
我們很榮幸地邀請到了在 IBM Consulting 擔任大數據工程師的 Kenny ,以大數據下的技術演變作為主題,與我們分享他的職涯。

大數據帶來自動化

隨著網路越來越發達,資料來源也變越來越多(例如:第三方公開觀測數據、Google 分析資料、CRM 等),以往讓員工手動製成報表,不但費時費力,還可能大幅提升錯誤的機率。現今,數據工程師透過ETL Extraction Transform Load,就能將上述的複雜繁瑣行為,從手動改為自動化。

自動化了,但要給誰看?

除了工程師們直接匯報的上級主管,也許行銷部門、專案經理也都需要知道分析的結果,以便輔助該部門做出決策。因此,新型態的資料庫: 資料倉儲(Data Warehouse) 取代了傳統的方式,可以儲存並展示更多來源的資料。
然而,此時的資料倉儲只能儲存表格式的資料,對於工程師來說可能在取得資料上還是有點困難。因此出現了更新的版本:資料湖泊(Data Lake),可以用來儲存結構及非結構的資料,而工程師可以從這裡直接取得需要的資料。

ETL的單多工變化

原本的 ETL(Extract - Transform - Load),是用來描述將資料從來源端經過抽取、轉置、載入至目的端的過程。單線程的 ETL 處理方式,就像是學生小考後,要排隊(單線程)等待助教改完考卷才能走。大家可以試想看看,若是只有一位助教,豈不是光是等考卷改完都等到天黑了呢?而多線程的 ETL 處理方式則是,大家考完後將考卷放在桌子上就可以走了,助教照著自己的速度拿考卷來改,並且可能聘請更多的助教。這樣是不是比較符合我們的日常,也比較有效率呢?這就是改為多線程的好處,能夠大幅降低加載的時間。而 AWS 也提供了不少服務,讓數據工程師跟數據科學家工作起來更加輕鬆容易,像是 EMR, Athena, S3, RDS, SageMaker, QuickSight 等,有興趣的朋友們不妨研究並使用看看喲!

AWS - Cloud Support Engineer

在來到 IBM 之前,Kenny 曾當過 AWS 的雲端支援工程師。並負責大數據相關的服務。
他的工作職責有:
  1. 指導客戶
    作為一個雲端支援工程師,要去跟客戶解釋這些會用到的服務。當客戶會不清楚或是觀念錯誤,就得要像一個線上家教般耐心指導客戶。Kenny 也提到,有時客戶會開緊急案件,需要在短時間內觀察客戶用法,並且有效率的解決客戶問題。
  2. 尋找問題根源
    要成為一個成功的雲端支援工程師,必須要能夠找到問題及發生的原因。此時「有邏輯和系統性去排查問題發生的原因」就會非常重要,像是去看日誌和指標,慢慢收斂問題的原因。
  3. 為客戶著想
    「不是努力思考怎麼賺客戶更多錢,而是努力替他們省錢省力。」大多數企業最終目標都是追求利潤,但是 AWS 則是將重點放在「提供最好的服務」,讓客戶有效率又省錢地解決問題。

決定轉職

Kenny 在學生時期大部分都是擔任開發角色,但第一份工作卻主要是排除問題,能寫到程式的比例較低。他漸漸發覺自己對程式的熟練度下降,且工作都是以個案問題為起始與結束,較為單點發散式,無法彙整起來。因此決定暫時離開,去找開發相關的工作。
但Kenny也提到:單點發散式的工作未必不好,因為每天的工作都是很獨立的個案問題,讓他在未來做事時的效率跟反應速度都提升了不少!

IBM Consulting - Big Data Engineer

作為大數據工程師,Kenny 要了解客戶需求,並且開發系統來滿足客戶。
其工作內容有:
  1. 專案導向
    在擔任大數據工程師時以專案為單位去解決。例如:協助半導體廠,將大型資料軟體上雲。
  2. 跨國開發
    Kenny 需要帶領台灣、印度工程師,與美國架構師合作開發。這對他而言是第一次的跨國開發體驗,需要去思考不同文化間要怎麼合作,才能共同完成專案。
  3. 專業顧問
    客戶會尋求外部協助就是因為他們不清楚上雲的方式及相關內容,而此時就應該要去了解客戶的狀況與需求,結合之前的經驗,給予客戶最好的解決方案。

上雲有多難

也許很多人會認為:上雲不就是把程式碼直接搬到雲的環境就可以用了嗎?
但是 Kenny 說了:能順利是可遇不可求的!
上雲可以大略分為四種難易程度:
  1. Lift and Shift - 最簡單,直接移過去就完成!
  2. Rebuilding - 在既有的程式碼上做點更動,使其在雲端上可以運作。
  3. Replacing - 需要改更多的程式碼,才能更好的利用雲端帶來的好處。
  4. Refactoring - 原本的程式碼有可能是十幾年前寫的,因此要重寫邏輯才能運用到雲端上,難度最高,也需要更最多工時,卻也能更多能夠優化的機會。

準備證照!要考證照的快點筆記!

想要進入 AWS ,手上擁有幾張證照一定會有所加分!因此 Kenny 也不藏私地與我們分享了考證照資源:
  1. 課程 - 官方提供的資源、Udemy、learn.A CLOUD GURU
  2. 部落格 - 有整理過的文章,常出現的考試內容
  3. 題庫 - 跟考試內容相當接近,強烈建議考生可以練習
---------------
Kenny 非常用心,為了讓我們能更好理解後續提到的工作內容,因此先用了許多故事般的敘述或比喻,為我們闡述了隨著大數據的出現,各項流程及工作是如何演進。讓我們瞭解了基本的資料處理程序後,再分享了在兩邊工作的職責、心得與差異,最後也大方地分享了準備證照的資源。相信經過這兩個小時的 Training,身為大使的我們不緊提升了自己的技術知識,更豐富了對這些職位的認識!
大使們與Kenny(圖中上)度過了完美的夜晚。
為什麼會看到廣告
avatar-img
20會員
29內容數
AWS Startup Content Team
留言0
查看全部
avatar-img
發表第一個留言支持創作者!
AWS Educate的沙龍 的其他內容
本篇文章要介紹的是 AWS 的雲端運算服務 —— Amazon Elastic Compute Cloud (EC2),文末也會帶領讀者使用 EC2 建立 Web Server。
【人物專訪】企劃是由 AWS Educate PR Team 主導的一項全新計畫!! 這次人物專訪邀請到的是在104資訊科技擔任Data Engineer的Scott Hsieh來與我們分享雲端學習和使用經驗,同時他也是AWS Community builder Program的成員之一。
十分榮幸本次能夠邀請到雲端大使偉傑與我們分享雲端相關的所見所聞,以及擔任大使期間的豐富經驗及心得,下文以四大主軸回顧本場精彩的分享。
本篇文章要和大家介紹的是 AWS 的重量級核心服務之一 —— Amazon Simple Storage Service (因為名字有3個 S 簡稱 S3),S3屬於物件儲存,會依據資料的頻繁度把資料存放到相應類別。
很榮幸 AWS Educate Ambassador 在 11 月份邀請到 Vocus 方格子的創辦人翁子騏先生與我們分享媒體產業的演進史、方格子作為新興媒體的理念與經營策略、以及踏上創業路的心路歷程,本文以三大主軸回顧本場精彩的分享!
你是否有過使用機器學習時,卻需要人工審查的經驗呢? AWS 的 Amazon Augmented AI (Amazon A2I)是一項機器學習服務,簡化了為 ML 應用程序構建和管理人工審核的過程,讓你可以輕鬆建置人工審查所需的工作流程!
本篇文章要介紹的是 AWS 的雲端運算服務 —— Amazon Elastic Compute Cloud (EC2),文末也會帶領讀者使用 EC2 建立 Web Server。
【人物專訪】企劃是由 AWS Educate PR Team 主導的一項全新計畫!! 這次人物專訪邀請到的是在104資訊科技擔任Data Engineer的Scott Hsieh來與我們分享雲端學習和使用經驗,同時他也是AWS Community builder Program的成員之一。
十分榮幸本次能夠邀請到雲端大使偉傑與我們分享雲端相關的所見所聞,以及擔任大使期間的豐富經驗及心得,下文以四大主軸回顧本場精彩的分享。
本篇文章要和大家介紹的是 AWS 的重量級核心服務之一 —— Amazon Simple Storage Service (因為名字有3個 S 簡稱 S3),S3屬於物件儲存,會依據資料的頻繁度把資料存放到相應類別。
很榮幸 AWS Educate Ambassador 在 11 月份邀請到 Vocus 方格子的創辦人翁子騏先生與我們分享媒體產業的演進史、方格子作為新興媒體的理念與經營策略、以及踏上創業路的心路歷程,本文以三大主軸回顧本場精彩的分享!
你是否有過使用機器學習時,卻需要人工審查的經驗呢? AWS 的 Amazon Augmented AI (Amazon A2I)是一項機器學習服務,簡化了為 ML 應用程序構建和管理人工審核的過程,讓你可以輕鬆建置人工審查所需的工作流程!
你可能也想看
Google News 追蹤
Thumbnail
嘿,大家新年快樂~ 新年大家都在做什麼呢? 跨年夜的我趕工製作某個外包設計案,在工作告一段落時趕上倒數。 然後和兩個小孩過了一個忙亂的元旦。在深夜時刻,看到朋友傳來的解籤網站,興致勃勃熬夜體驗了一下,覺得非常好玩,或許有人玩過了,但還是想寫上來分享紀錄一下~
Thumbnail
在ETL架構中,許多使用者會將S3 Data Lake與Crawlers及Athena結合使用,然而是否可以用Glue Job取代Crawlers呢?本文探討了S3 Data Lake的運作流程,解釋了Crawler、Data Catalog和Glue Job在數據處理中的角色與功能差異。
Snowflake 是一家基於雲端運算的數據庫公司,提供「data warehouse-as-a-service」的雲端數據存儲和分析服務。透過 Snowflake,用戶可以使用雲端硬體和軟體存儲及分析資料。本教學將介紹如何使用 Python 將不同平台上的資料上傳至 Snowflake。
Thumbnail
本文談及資料科學的領域與分工。首先是建造一個AI的研發流程,資料收集到 AI 模型訓練的過程,AI經歷這一切流程被創造出來並產生價值;再來本文也提及在這個領域中的各種腳色、資料工程師、數據庫工程師、資料科學家和資料分析師的各種介紹。並且強調跨領域合作的重要性。
Thumbnail
對 AWS Certified Cloud Practitioner 證照考試難度的看法、學習方法和考試內容的介紹。
Thumbnail
本文介紹了 Docker 的基礎概念,以及在軟體工程環境中的運用。藉由 Docker 的容器化技術和映像檔技術,能夠實現開發和生產環境的一致性,並且支持負載平衡和無縫更新。此外,也提到了 Kubernetes 和 Docker Swarm 這兩個重要工具的用途和適用對象。
Thumbnail
ETL是資料倉儲領域中一個重要的概念,全稱為Extract-Transform-Load,中文可譯為"抽取-轉換-載入"。ETL的作用是將來自不同來源的資料抽取出來,經過清理、轉換、整合等處理後,最終將處理好的資料載入到資料倉儲或其他單一的資料存放區
Thumbnail
本文討論了人類在面對變化時的應對策略,包括數據分析的重要性,科技趨勢對工作形態的影響,以及對無條件基本收入的討論。透過工程師職涯教練Yi姐豐富的經驗,分享如何運用數據進行更好的決策,探討寫作和自媒體創業的投資報酬率,以及對未來的靈活規劃。
Thumbnail
分享關於 AWS CLF-C02 考試的準備心得,包括考試主要範圍、準備過程中的學習資源及建議,以及考試當日的流程和心得。希望本文能為欲嘗試取得此認證的人提供心得與參考。
Thumbnail
這是文科轉職數據工程師系列的第一篇文章。 許多人會在轉職前上許多數據分析課程,該怎麼選擇比較適合自己,但又不會噴錢呢? 這篇文章要介紹這個轉職過程前的準備工作。
Thumbnail
嘿,大家新年快樂~ 新年大家都在做什麼呢? 跨年夜的我趕工製作某個外包設計案,在工作告一段落時趕上倒數。 然後和兩個小孩過了一個忙亂的元旦。在深夜時刻,看到朋友傳來的解籤網站,興致勃勃熬夜體驗了一下,覺得非常好玩,或許有人玩過了,但還是想寫上來分享紀錄一下~
Thumbnail
在ETL架構中,許多使用者會將S3 Data Lake與Crawlers及Athena結合使用,然而是否可以用Glue Job取代Crawlers呢?本文探討了S3 Data Lake的運作流程,解釋了Crawler、Data Catalog和Glue Job在數據處理中的角色與功能差異。
Snowflake 是一家基於雲端運算的數據庫公司,提供「data warehouse-as-a-service」的雲端數據存儲和分析服務。透過 Snowflake,用戶可以使用雲端硬體和軟體存儲及分析資料。本教學將介紹如何使用 Python 將不同平台上的資料上傳至 Snowflake。
Thumbnail
本文談及資料科學的領域與分工。首先是建造一個AI的研發流程,資料收集到 AI 模型訓練的過程,AI經歷這一切流程被創造出來並產生價值;再來本文也提及在這個領域中的各種腳色、資料工程師、數據庫工程師、資料科學家和資料分析師的各種介紹。並且強調跨領域合作的重要性。
Thumbnail
對 AWS Certified Cloud Practitioner 證照考試難度的看法、學習方法和考試內容的介紹。
Thumbnail
本文介紹了 Docker 的基礎概念,以及在軟體工程環境中的運用。藉由 Docker 的容器化技術和映像檔技術,能夠實現開發和生產環境的一致性,並且支持負載平衡和無縫更新。此外,也提到了 Kubernetes 和 Docker Swarm 這兩個重要工具的用途和適用對象。
Thumbnail
ETL是資料倉儲領域中一個重要的概念,全稱為Extract-Transform-Load,中文可譯為"抽取-轉換-載入"。ETL的作用是將來自不同來源的資料抽取出來,經過清理、轉換、整合等處理後,最終將處理好的資料載入到資料倉儲或其他單一的資料存放區
Thumbnail
本文討論了人類在面對變化時的應對策略,包括數據分析的重要性,科技趨勢對工作形態的影響,以及對無條件基本收入的討論。透過工程師職涯教練Yi姐豐富的經驗,分享如何運用數據進行更好的決策,探討寫作和自媒體創業的投資報酬率,以及對未來的靈活規劃。
Thumbnail
分享關於 AWS CLF-C02 考試的準備心得,包括考試主要範圍、準備過程中的學習資源及建議,以及考試當日的流程和心得。希望本文能為欲嘗試取得此認證的人提供心得與參考。
Thumbnail
這是文科轉職數據工程師系列的第一篇文章。 許多人會在轉職前上許多數據分析課程,該怎麼選擇比較適合自己,但又不會噴錢呢? 這篇文章要介紹這個轉職過程前的準備工作。