大數據下的技術演變 ❘ 焦點人物訪談 ❘ Kenny( IBM Consulting 大數據工程師)

閱讀時間約 5 分鐘
我們很榮幸地邀請到了在 IBM Consulting 擔任大數據工程師的 Kenny ,以大數據下的技術演變作為主題,與我們分享他的職涯。

大數據帶來自動化

隨著網路越來越發達,資料來源也變越來越多(例如:第三方公開觀測數據、Google 分析資料、CRM 等),以往讓員工手動製成報表,不但費時費力,還可能大幅提升錯誤的機率。現今,數據工程師透過ETL Extraction Transform Load,就能將上述的複雜繁瑣行為,從手動改為自動化。

自動化了,但要給誰看?

除了工程師們直接匯報的上級主管,也許行銷部門、專案經理也都需要知道分析的結果,以便輔助該部門做出決策。因此,新型態的資料庫: 資料倉儲(Data Warehouse) 取代了傳統的方式,可以儲存並展示更多來源的資料。
然而,此時的資料倉儲只能儲存表格式的資料,對於工程師來說可能在取得資料上還是有點困難。因此出現了更新的版本:資料湖泊(Data Lake),可以用來儲存結構及非結構的資料,而工程師可以從這裡直接取得需要的資料。

ETL的單多工變化

原本的 ETL(Extract - Transform - Load),是用來描述將資料從來源端經過抽取、轉置、載入至目的端的過程。單線程的 ETL 處理方式,就像是學生小考後,要排隊(單線程)等待助教改完考卷才能走。大家可以試想看看,若是只有一位助教,豈不是光是等考卷改完都等到天黑了呢?而多線程的 ETL 處理方式則是,大家考完後將考卷放在桌子上就可以走了,助教照著自己的速度拿考卷來改,並且可能聘請更多的助教。這樣是不是比較符合我們的日常,也比較有效率呢?這就是改為多線程的好處,能夠大幅降低加載的時間。而 AWS 也提供了不少服務,讓數據工程師跟數據科學家工作起來更加輕鬆容易,像是 EMR, Athena, S3, RDS, SageMaker, QuickSight 等,有興趣的朋友們不妨研究並使用看看喲!

AWS - Cloud Support Engineer

在來到 IBM 之前,Kenny 曾當過 AWS 的雲端支援工程師。並負責大數據相關的服務。
他的工作職責有:
  1. 指導客戶
    作為一個雲端支援工程師,要去跟客戶解釋這些會用到的服務。當客戶會不清楚或是觀念錯誤,就得要像一個線上家教般耐心指導客戶。Kenny 也提到,有時客戶會開緊急案件,需要在短時間內觀察客戶用法,並且有效率的解決客戶問題。
  2. 尋找問題根源
    要成為一個成功的雲端支援工程師,必須要能夠找到問題及發生的原因。此時「有邏輯和系統性去排查問題發生的原因」就會非常重要,像是去看日誌和指標,慢慢收斂問題的原因。
  3. 為客戶著想
    「不是努力思考怎麼賺客戶更多錢,而是努力替他們省錢省力。」大多數企業最終目標都是追求利潤,但是 AWS 則是將重點放在「提供最好的服務」,讓客戶有效率又省錢地解決問題。

決定轉職

Kenny 在學生時期大部分都是擔任開發角色,但第一份工作卻主要是排除問題,能寫到程式的比例較低。他漸漸發覺自己對程式的熟練度下降,且工作都是以個案問題為起始與結束,較為單點發散式,無法彙整起來。因此決定暫時離開,去找開發相關的工作。
但Kenny也提到:單點發散式的工作未必不好,因為每天的工作都是很獨立的個案問題,讓他在未來做事時的效率跟反應速度都提升了不少!

IBM Consulting - Big Data Engineer

作為大數據工程師,Kenny 要了解客戶需求,並且開發系統來滿足客戶。
其工作內容有:
  1. 專案導向
    在擔任大數據工程師時以專案為單位去解決。例如:協助半導體廠,將大型資料軟體上雲。
  2. 跨國開發
    Kenny 需要帶領台灣、印度工程師,與美國架構師合作開發。這對他而言是第一次的跨國開發體驗,需要去思考不同文化間要怎麼合作,才能共同完成專案。
  3. 專業顧問
    客戶會尋求外部協助就是因為他們不清楚上雲的方式及相關內容,而此時就應該要去了解客戶的狀況與需求,結合之前的經驗,給予客戶最好的解決方案。

上雲有多難

也許很多人會認為:上雲不就是把程式碼直接搬到雲的環境就可以用了嗎?
但是 Kenny 說了:能順利是可遇不可求的!
上雲可以大略分為四種難易程度:
  1. Lift and Shift - 最簡單,直接移過去就完成!
  2. Rebuilding - 在既有的程式碼上做點更動,使其在雲端上可以運作。
  3. Replacing - 需要改更多的程式碼,才能更好的利用雲端帶來的好處。
  4. Refactoring - 原本的程式碼有可能是十幾年前寫的,因此要重寫邏輯才能運用到雲端上,難度最高,也需要更最多工時,卻也能更多能夠優化的機會。

準備證照!要考證照的快點筆記!

想要進入 AWS ,手上擁有幾張證照一定會有所加分!因此 Kenny 也不藏私地與我們分享了考證照資源:
  1. 課程 - 官方提供的資源、Udemy、learn.A CLOUD GURU
  2. 部落格 - 有整理過的文章,常出現的考試內容
  3. 題庫 - 跟考試內容相當接近,強烈建議考生可以練習
---------------
Kenny 非常用心,為了讓我們能更好理解後續提到的工作內容,因此先用了許多故事般的敘述或比喻,為我們闡述了隨著大數據的出現,各項流程及工作是如何演進。讓我們瞭解了基本的資料處理程序後,再分享了在兩邊工作的職責、心得與差異,最後也大方地分享了準備證照的資源。相信經過這兩個小時的 Training,身為大使的我們不緊提升了自己的技術知識,更豐富了對這些職位的認識!
大使們與Kenny(圖中上)度過了完美的夜晚。
為什麼會看到廣告
avatar-img
20會員
29內容數
AWS Startup Content Team
留言0
查看全部
avatar-img
發表第一個留言支持創作者!
AWS Educate的沙龍 的其他內容
本篇文章要介紹的是 AWS 的雲端運算服務 —— Amazon Elastic Compute Cloud (EC2),文末也會帶領讀者使用 EC2 建立 Web Server。
【人物專訪】企劃是由 AWS Educate PR Team 主導的一項全新計畫!! 這次人物專訪邀請到的是在104資訊科技擔任Data Engineer的Scott Hsieh來與我們分享雲端學習和使用經驗,同時他也是AWS Community builder Program的成員之一。
十分榮幸本次能夠邀請到雲端大使偉傑與我們分享雲端相關的所見所聞,以及擔任大使期間的豐富經驗及心得,下文以四大主軸回顧本場精彩的分享。
本篇文章要和大家介紹的是 AWS 的重量級核心服務之一 —— Amazon Simple Storage Service (因為名字有3個 S 簡稱 S3),S3屬於物件儲存,會依據資料的頻繁度把資料存放到相應類別。
很榮幸 AWS Educate Ambassador 在 11 月份邀請到 Vocus 方格子的創辦人翁子騏先生與我們分享媒體產業的演進史、方格子作為新興媒體的理念與經營策略、以及踏上創業路的心路歷程,本文以三大主軸回顧本場精彩的分享!
你是否有過使用機器學習時,卻需要人工審查的經驗呢? AWS 的 Amazon Augmented AI (Amazon A2I)是一項機器學習服務,簡化了為 ML 應用程序構建和管理人工審核的過程,讓你可以輕鬆建置人工審查所需的工作流程!
本篇文章要介紹的是 AWS 的雲端運算服務 —— Amazon Elastic Compute Cloud (EC2),文末也會帶領讀者使用 EC2 建立 Web Server。
【人物專訪】企劃是由 AWS Educate PR Team 主導的一項全新計畫!! 這次人物專訪邀請到的是在104資訊科技擔任Data Engineer的Scott Hsieh來與我們分享雲端學習和使用經驗,同時他也是AWS Community builder Program的成員之一。
十分榮幸本次能夠邀請到雲端大使偉傑與我們分享雲端相關的所見所聞,以及擔任大使期間的豐富經驗及心得,下文以四大主軸回顧本場精彩的分享。
本篇文章要和大家介紹的是 AWS 的重量級核心服務之一 —— Amazon Simple Storage Service (因為名字有3個 S 簡稱 S3),S3屬於物件儲存,會依據資料的頻繁度把資料存放到相應類別。
很榮幸 AWS Educate Ambassador 在 11 月份邀請到 Vocus 方格子的創辦人翁子騏先生與我們分享媒體產業的演進史、方格子作為新興媒體的理念與經營策略、以及踏上創業路的心路歷程,本文以三大主軸回顧本場精彩的分享!
你是否有過使用機器學習時,卻需要人工審查的經驗呢? AWS 的 Amazon Augmented AI (Amazon A2I)是一項機器學習服務,簡化了為 ML 應用程序構建和管理人工審核的過程,讓你可以輕鬆建置人工審查所需的工作流程!
你可能也想看
Google News 追蹤
Thumbnail
Hi 我是 VK~ 在 8 月底寫完〈探索 AI 時代的知識革命:NotebookLM 如何顛覆學習和創作流程?〉後,有機會在 INSIDE POSSIBE 分享兩次「和 NotebookLM 協作如何改變我學習和創作」的主題,剛好最近也有在許多地方聊到關於 NotebookLM 等 AI 工具
Thumbnail
國泰CUBE App 整合外幣換匯、基金、證券等服務,提供簡便、低成本的美股定期定額投資解決方案。 5分鐘開戶、低投資門檻,幫助新手輕鬆進軍國際股市;提供人氣排行榜,讓投資人能夠掌握市場趨勢。
Thumbnail
這是張老師的第三本書,我想前二本應該也有很多朋友們都有讀過,我想絕對是受益良多,而這次在書名上就直接點出,著重在從投資的角度來切入
Thumbnail
哲學的思考方法為,一假設問題的提出,然後再藉由論證的方式證成一預設的概念,最後獲得一個解答、一個立場、一個理論。不管是哲學理論或科學理論,都共同面對一個問題─理論永遠只反映事實的某個片段而已;因為形成理論的過程,是一個將複雜問題「簡化」的過程。哲學方法有沒有可能反應真實的複雜呢?當哲學能夠反
Thumbnail
這是一本關於美國大聯盟奧克蘭運動家隊的總經理與助理,利用大數據進行球員挑選的故事。書中揭示了棒球統計對球員挑選和球隊經營的重要性,呈現了大數據時代的棒球故事。
Thumbnail
為了讀書會開始認真讀起買了但是放在書架上很久的中國研究相關書籍,挑上這一本就是看上大數據監控的部分。全書談的是中國的監控,而有別於單談新疆的大監控與再教育營,但實際上讀來,就是密度、強度的差異,手法類似,也恐怖莫名。 先從中共政權的槍桿子、筆桿子談起,先是集權的暴力壓迫,少數的族裔還有聲音消音在世
Thumbnail
在交易千萬別見樹不見林 中示範如何在同一張圖表上加入不同週期的行情走勢,本篇將對MultiCharts初體驗-函式撰寫、MultiCharts初體驗-訊號撰寫 的程式進行改寫,讓程式可以讀取到多週期的K線資料。 在MC中可以用Data1、Data2、⋯⋯、Data99的指定方式,來存取圖表中的數列
Thumbnail
最近在網路上看到一個由大陸中科院於2019年所發展的『金屬構築成形技術』,該技術發展源致於中國第四代大型核反應爐用SUS316不銹鋼支撐環,其直徑15.6米並重達150公噸,類似這種大型中空環型件一般有兩種製造方式: 1.多段焊接 如此巨型的不鏽鋼環型件,按照往常的製造法,都會先鍛出8-9個分段,再
    從另一個角度看變形記中隱隱然呈現出的觀念,即是馬克思所述的異化。無論是人與人之間關係的疏離,抑或人無法與其勞動產生認同,都是工業化後的資本主義的產物,在這之中一切強調量化與理性,讓這台機器能夠運轉的效率最大化,卻因為忽略了人身為人的事實,走向了所謂的「工具理性」,個人特質就在這之中量化、概括
Thumbnail
最近中國大陸打擊遊戲業,批評遊戲是青少年的精神鴉片,延伸閱讀:人民網, 有孩子1天玩8小時網游!精神鴉片竟長成數千億產業? 文章裡面有一段,讓我很有感觸的話:  游戲是如何吸引玩家增加“粘性”,甚至激發心理弱點的?據一些游戲公司人士介紹,一些游戲公司聘用了大量專家專門研究玩家消費心理和心理弱點,
Thumbnail
韓國星巴克是如何打破網路與實體的界線,了解消費者行為、洞察消費者心理,為企業創造出更多利益的?在這篇文章中,告訴你三件事:面對數據,如何合理地看待它能發揮的價值?面對問題,如何正確地從數據中找出答案?面對市場,如何有效地解讀數據並運用在行銷上?
Thumbnail
Hi 我是 VK~ 在 8 月底寫完〈探索 AI 時代的知識革命:NotebookLM 如何顛覆學習和創作流程?〉後,有機會在 INSIDE POSSIBE 分享兩次「和 NotebookLM 協作如何改變我學習和創作」的主題,剛好最近也有在許多地方聊到關於 NotebookLM 等 AI 工具
Thumbnail
國泰CUBE App 整合外幣換匯、基金、證券等服務,提供簡便、低成本的美股定期定額投資解決方案。 5分鐘開戶、低投資門檻,幫助新手輕鬆進軍國際股市;提供人氣排行榜,讓投資人能夠掌握市場趨勢。
Thumbnail
這是張老師的第三本書,我想前二本應該也有很多朋友們都有讀過,我想絕對是受益良多,而這次在書名上就直接點出,著重在從投資的角度來切入
Thumbnail
哲學的思考方法為,一假設問題的提出,然後再藉由論證的方式證成一預設的概念,最後獲得一個解答、一個立場、一個理論。不管是哲學理論或科學理論,都共同面對一個問題─理論永遠只反映事實的某個片段而已;因為形成理論的過程,是一個將複雜問題「簡化」的過程。哲學方法有沒有可能反應真實的複雜呢?當哲學能夠反
Thumbnail
這是一本關於美國大聯盟奧克蘭運動家隊的總經理與助理,利用大數據進行球員挑選的故事。書中揭示了棒球統計對球員挑選和球隊經營的重要性,呈現了大數據時代的棒球故事。
Thumbnail
為了讀書會開始認真讀起買了但是放在書架上很久的中國研究相關書籍,挑上這一本就是看上大數據監控的部分。全書談的是中國的監控,而有別於單談新疆的大監控與再教育營,但實際上讀來,就是密度、強度的差異,手法類似,也恐怖莫名。 先從中共政權的槍桿子、筆桿子談起,先是集權的暴力壓迫,少數的族裔還有聲音消音在世
Thumbnail
在交易千萬別見樹不見林 中示範如何在同一張圖表上加入不同週期的行情走勢,本篇將對MultiCharts初體驗-函式撰寫、MultiCharts初體驗-訊號撰寫 的程式進行改寫,讓程式可以讀取到多週期的K線資料。 在MC中可以用Data1、Data2、⋯⋯、Data99的指定方式,來存取圖表中的數列
Thumbnail
最近在網路上看到一個由大陸中科院於2019年所發展的『金屬構築成形技術』,該技術發展源致於中國第四代大型核反應爐用SUS316不銹鋼支撐環,其直徑15.6米並重達150公噸,類似這種大型中空環型件一般有兩種製造方式: 1.多段焊接 如此巨型的不鏽鋼環型件,按照往常的製造法,都會先鍛出8-9個分段,再
    從另一個角度看變形記中隱隱然呈現出的觀念,即是馬克思所述的異化。無論是人與人之間關係的疏離,抑或人無法與其勞動產生認同,都是工業化後的資本主義的產物,在這之中一切強調量化與理性,讓這台機器能夠運轉的效率最大化,卻因為忽略了人身為人的事實,走向了所謂的「工具理性」,個人特質就在這之中量化、概括
Thumbnail
最近中國大陸打擊遊戲業,批評遊戲是青少年的精神鴉片,延伸閱讀:人民網, 有孩子1天玩8小時網游!精神鴉片竟長成數千億產業? 文章裡面有一段,讓我很有感觸的話:  游戲是如何吸引玩家增加“粘性”,甚至激發心理弱點的?據一些游戲公司人士介紹,一些游戲公司聘用了大量專家專門研究玩家消費心理和心理弱點,
Thumbnail
韓國星巴克是如何打破網路與實體的界線,了解消費者行為、洞察消費者心理,為企業創造出更多利益的?在這篇文章中,告訴你三件事:面對數據,如何合理地看待它能發揮的價值?面對問題,如何正確地從數據中找出答案?面對市場,如何有效地解讀數據並運用在行銷上?