Java 8 初探 - Stream

更新於 發佈於 閱讀時間約 7 分鐘
此為過去的舊文,2014 年 4 月 13 日初次發表於 logdown。

即使沒有 Stream,Java Collection framework 的設計仍是相當不錯,只是有時候需要一些簡單的功能,例如:根據某些條件查找容器中的某個物件,總是要寫個 for 迴圈,程式不難但寫久了也覺得煩。在沒有類似 for in 的語法糖衣之前,index 的管理很惱人。若是巢狀迴圈,index 命名不好遇到問題 debug 起來更是頭痛,用過 Apache Commons Collections 後,Apache Commons Collections 幾乎是專案裡必備的套件。先來個簡單例子,假設想在放 Person 物件的 List 中找姓名含某個特定值時,傳統的寫法如下,會是寫一個 for 迴圈,然後逐一檢查每個person物件的姓和名。

那如果用 Apache Commons Collections 又會如何呢?請看下面的範例,基本上不需要寫 for 迴圈,只要在呼叫 find 時傳一個實作 Predicate 介面的物件即可,該物件只需要實作 evaluate 這個method,判斷是否滿足條件,滿足回傳 true,就這樣。什麼!程式碼行數變多,沒錯,確實變多,但 PersonNamePredicate 這物件是可以重複使用的,若觀察 CollectionUtils 這個 class 就會發現有 12 個 methods 利用 Predicate 物件對容器進行過濾、選擇、計數等操作,加上 Predicate 的實作要測試很容易,所以這樣寫很划算。

好啦!既然主題是 Java 8 新的 Stream API,那用 Stream 該怎麼寫?Stream 的寫法會像下面範例,好像沒有比較省行數,但和原始的 for 迴圈相比,就語意上或是可讀性上,這版本可以解讀成『根據一某條件過濾,然後找第一個,如果結果存在就回傳該物件,不存在就回傳 null』,迴圈的操過被忽略了,是否有感覺抽象程度被提高了呢?

那如果要像 Apache Commons Collections 那樣,可以辦到嗎?可以!首先,像下例,寫個 StreamUtils 輔助類別,提供一個 find(Collection, Predicate) 函式,然後改寫 PersonNamePredicate,接著就可以只寫一行就搞定。當然,如果不打算讓 PersonNamePredicate 同時支援 Apache Commons Collections 及 Java Stream,只需實作 java.util.Predicate 介面的 test 函式就好。

不過繞了一大圈,為的是什麼?除了使用parallelStream()可能帶來平行處理的好處外,這個版本並沒有帶來太多的好處,主要是應用(find)太簡單了,用Stream有點殺雞用牛刀的感覺。

Java Stream API 的概念類似 Unix Pipelinepipes and filters design pattern,透過串接多個簡單的 operation 完成有意義的工作,由於 operation 通常都很簡單,所以使用 Lambda expression 多數時候可以帶來簡潔和提升可讀性的好處。


Figure 1 - Stream Pipeline

Figure 1 - Stream Pipeline


如 Figure 1 所示,Java Stream 能串多個 intermediate operations,但最後只能串一個 terminal operation 來組成 pipeline。用 intermediate operation 轉換 stream 內容,例如:過濾 (filter(Predicate))、替換 (map(Function))、排序 (sorted(Comparator)) 等,然後用 terminal operation 對 stream 內的資料計算最終結果或產生 side effect,例如:收集 (collect(Collector))、逐一改變 (forEach(Consumer)) 或歸納 (Reduce(BinaryOperator)) 等。


Figure 2 - Stream Pipeline Example

Figure 2 - Stream Pipeline Example


例如,可以用 Figure 2 的 pipeline 來計算資料中資產超過 10 億元的富豪,其資產的總合,首先 filter(Predicate) 過濾出資產超過 10 億元的資料,接著用 map(Function) 取出資產的部分,最後用 reduce(BinaryOperation) 做歸納。事實上,類似的運算實在太常用了,因此 Java Stream API 中有個 Collectors 類別提供常用的 terminal operation,例如 summarizingDouble(ToDoubleFunction) 就結合了 map(Function) 和預設的 reduce(BinaryOperation) 實作,簡化 pipeline 的組成。

覺得例子有點抽象?那再來一個更具體的例子吧。假設 Exam 代表一種測驗,每個人可以參加多次測驗,因此 Person 有一個 List 存放受測者參加過的所有測驗。假如想要取得曾經得超過 700 分的所有受測者排名,為了不寫重複的程式碼,如下面的範例程式,先將取得受測者曾經參加過的測驗最高分寫成 PersongetHighestScore() 函式 (仍用Stream API)。

接著就可以寫一個 showRank(List<Person>, double) 的函式,第一個參數是所有受測者,第二個參數是排行榜顯示的門檻。程式首先呼叫 stream() 取得 Stream 物件,接著對 Stream 呼叫 filter(Predicate) 函式,這裡用 Lambda Expression 就覺得很自然,也提高可讀性。

過濾掉低於門檻值的受測者後,呼叫 sorted(Comparator) 進行排序,然後 map(Function) 將受測者的全名與分數組成字串 (例如:"Spirit Tu: 840.0") 當成結果,這邊要小心的是 map(Function) 所回傳的 Stream 物件,裡面裝的已經不是 Person 物件了,而是字串,所以 forEach(Consumer) 的 Lambda Expression 中,e 代表的是字串,直接就可以顯示在 console 上。

最後,呼叫 showRank(persons, 700) 就可以看到曾經得超過 700 分的受測者排行榜了。整個流程可以畫成如 Figure 3的 pipeline。


Figure 3 - The pipeline for showRank

Figure 3 - The pipeline for showRank


老實說,看到 Java Sream API 讓我感到相當親切,這應該跟我研究所多年的研究題目是 visual dataflow language 有關,在 VisualTPL 中,迴圈的概念被內化了,重點在於做什麼運算 (what),而不是如何跑迴圈 (how),同樣地,Java Stream API 也是把迴圈給內化了,每個 operation 的重點是要做什麼,大大提高了程式的抽象化程度和可讀性。不過 Java Stream API 的特色還不只這些,剩下的下一篇再討論。

留言
avatar-img
留言分享你的想法!
Spirit-avatar-img
發文者
2024/04/27
關於 Swift & Java 中 Optional 的設計提及了這篇文章,趕快過去看看吧!
Spirit-avatar-img
發文者
2024/04/26
Java 8 初探 - Parallel Array Sort提及了這篇文章,趕快過去看看吧!
avatar-img
Spirit的沙龍
53會員
105內容數
這是從 Medium 開始的一個專題,主要是想用輕鬆閒談的方式,分享這幾年軟體開發的心得,原本比較侷限於軟體架構,但這幾年的文章不僅限於架構,也聊不少流程相關的心得,所以趁換平台,順勢換成閒談軟體設計。
Spirit的沙龍的其他內容
2024/05/23
本書大多數的內容都以 OO 的概念出發,詳列了許多設計的臭味道,也有大量的例子。個人雖然不會這樣寫程式,但仍是覺得受益良多,至少在 code review 時能更清楚知道該怎麼描述問題。不過,即便不是用 OO 的概念,有些章節還是可以帶來一些想法,用 OO 概念寫程式的人更不該錯過這本好書。
Thumbnail
2024/05/23
本書大多數的內容都以 OO 的概念出發,詳列了許多設計的臭味道,也有大量的例子。個人雖然不會這樣寫程式,但仍是覺得受益良多,至少在 code review 時能更清楚知道該怎麼描述問題。不過,即便不是用 OO 的概念,有些章節還是可以帶來一些想法,用 OO 概念寫程式的人更不該錯過這本好書。
Thumbnail
2024/05/11
實際就業後,會發現收集與分析需求,通常都不是工程師在做,會有另一群人,以非工程的角度收集及分析需求,然後在開發過程中蹦出不同的火花,於是很好奇另一群人的想法是什麼?我不敢說這本書能完全代表另一群人的想法,但確實能夠得到很多有用的思維。推薦給所有的軟體工程師。
Thumbnail
2024/05/11
實際就業後,會發現收集與分析需求,通常都不是工程師在做,會有另一群人,以非工程的角度收集及分析需求,然後在開發過程中蹦出不同的火花,於是很好奇另一群人的想法是什麼?我不敢說這本書能完全代表另一群人的想法,但確實能夠得到很多有用的思維。推薦給所有的軟體工程師。
Thumbnail
2024/05/09
本書介紹了戰略設計、管理領域複雜度、實際應用領域驅動設計等主題。透過對核心子領域、支持子領域、限界上下文等概念的探討,提供了領域驅動設計的相關知識。這篇文章中還涉及了微服務、事件驅動架構和資料網格等相關主題,提供了設計系統和應用領域驅動設計的指導。
Thumbnail
2024/05/09
本書介紹了戰略設計、管理領域複雜度、實際應用領域驅動設計等主題。透過對核心子領域、支持子領域、限界上下文等概念的探討,提供了領域驅動設計的相關知識。這篇文章中還涉及了微服務、事件驅動架構和資料網格等相關主題,提供了設計系統和應用領域驅動設計的指導。
Thumbnail
看更多
你可能也想看
Thumbnail
沙龍一直是創作與交流的重要空間,這次 vocus 全面改版了沙龍介面,就是為了讓好內容被好好看見! 你可以自由編排你的沙龍首頁版位,新版手機介面也讓每位訪客都能更快找到感興趣的內容、成為你的支持者。 改版完成後可以在社群媒體分享新版面,並標記 @vocus.official⁠ ♥️ ⁠
Thumbnail
沙龍一直是創作與交流的重要空間,這次 vocus 全面改版了沙龍介面,就是為了讓好內容被好好看見! 你可以自由編排你的沙龍首頁版位,新版手機介面也讓每位訪客都能更快找到感興趣的內容、成為你的支持者。 改版完成後可以在社群媒體分享新版面,並標記 @vocus.official⁠ ♥️ ⁠
Thumbnail
每年4月、5月都是最多稅要繳的月份,當然大部份的人都是有機會繳到「綜合所得稅」,只是相當相當多人還不知道,原來繳給政府的稅!可以透過一些有活動的銀行信用卡或電子支付來繳,從繳費中賺一點點小確幸!就是賺個1%~2%大家也是很開心的,因為你們把沒回饋變成有回饋,就是用卡的最高境界 所得稅線上申報
Thumbnail
每年4月、5月都是最多稅要繳的月份,當然大部份的人都是有機會繳到「綜合所得稅」,只是相當相當多人還不知道,原來繳給政府的稅!可以透過一些有活動的銀行信用卡或電子支付來繳,從繳費中賺一點點小確幸!就是賺個1%~2%大家也是很開心的,因為你們把沒回饋變成有回饋,就是用卡的最高境界 所得稅線上申報
Thumbnail
本章節的目的是介紹Java中的套件使用,包括如何引用第三方套件和自定義模組,如何創建和使用自定義套件,以及介紹一些常見的Java標準庫套件。這些內容將幫助讀者更好地理解和使用Java的套件系統。
Thumbnail
本章節的目的是介紹Java中的套件使用,包括如何引用第三方套件和自定義模組,如何創建和使用自定義套件,以及介紹一些常見的Java標準庫套件。這些內容將幫助讀者更好地理解和使用Java的套件系統。
Thumbnail
本章節主要介紹Java語言中的函數(也稱為方法)的使用,包括函數的基本結構、函數表達式(Lambda表達式)、箭頭函數、匿名函數的使用,以及如何呼叫函數、如何使用函數參數和函數的返回值等內容。通過學習本章節,讀者將能夠熟練掌握Java語言中的函數相關知識,並能夠在實際編程中靈活運用。
Thumbnail
本章節主要介紹Java語言中的函數(也稱為方法)的使用,包括函數的基本結構、函數表達式(Lambda表達式)、箭頭函數、匿名函數的使用,以及如何呼叫函數、如何使用函數參數和函數的返回值等內容。通過學習本章節,讀者將能夠熟練掌握Java語言中的函數相關知識,並能夠在實際編程中靈活運用。
Thumbnail
此章節的目的是介紹Java程式語言中的流程控制結構,包括條件語句(if, else if, else)、三元運算子、switch語句,以及各種迴圈(for, foreach, while)。同時,也解釋了如何在迴圈中使用控制語句來改變程式的執行流程。每種主題都配有示例程式碼以幫助理解。
Thumbnail
此章節的目的是介紹Java程式語言中的流程控制結構,包括條件語句(if, else if, else)、三元運算子、switch語句,以及各種迴圈(for, foreach, while)。同時,也解釋了如何在迴圈中使用控制語句來改變程式的執行流程。每種主題都配有示例程式碼以幫助理解。
Thumbnail
此章節旨在介紹Java程式語言中的各種資料型別,包括基本型別、引用型別、集合型別、陣列型別、字典型別等。它還講解了如何在Java中進行型別轉換和自定義型別,並提供了相關的程式碼示例。
Thumbnail
此章節旨在介紹Java程式語言中的各種資料型別,包括基本型別、引用型別、集合型別、陣列型別、字典型別等。它還講解了如何在Java中進行型別轉換和自定義型別,並提供了相關的程式碼示例。
Thumbnail
此章節旨在介紹Java的基本語法、註解和變數的使用。透過學習,讀者將了解Java程式的基本結構、程式進入點的定義、如何撰寫單行和多行註解,以及如何宣告和初始化變數。
Thumbnail
此章節旨在介紹Java的基本語法、註解和變數的使用。透過學習,讀者將了解Java程式的基本結構、程式進入點的定義、如何撰寫單行和多行註解,以及如何宣告和初始化變數。
Thumbnail
這篇文章的目的是對Java程式設計語言進行介紹,包括它的特性、應用範疇、主要使用者,以及相關的學習資源和常見的庫與框架。此外,它也提供了一些學習Java的渠道,以及與Java相關的其他知識。
Thumbnail
這篇文章的目的是對Java程式設計語言進行介紹,包括它的特性、應用範疇、主要使用者,以及相關的學習資源和常見的庫與框架。此外,它也提供了一些學習Java的渠道,以及與Java相關的其他知識。
Thumbnail
這幾年新出的語言都強打在少寫 code 和提高可讀性,更重要的是能更容易發展出 domain specific language,就這一點 Java 確實有點顯得疲態了。其實文中列的特性大多是一些語法糖衣,但對程式的可讀性和抽象度都能提昇不少,我覺得挺實用也很划算的。
Thumbnail
這幾年新出的語言都強打在少寫 code 和提高可讀性,更重要的是能更容易發展出 domain specific language,就這一點 Java 確實有點顯得疲態了。其實文中列的特性大多是一些語法糖衣,但對程式的可讀性和抽象度都能提昇不少,我覺得挺實用也很划算的。
Thumbnail
Lazy evaluation 的效益必須是在 pipe 的組合上有最佳化過的,若組合的不好反而更糟糕,且在 I/O 上幫助似乎也不大。parallel stream 要能發揮效果必須看資料的來源類型,不過要注意的是 parallel stream 也會使記憶體的使用量增加,使用上也要小心。
Thumbnail
Lazy evaluation 的效益必須是在 pipe 的組合上有最佳化過的,若組合的不好反而更糟糕,且在 I/O 上幫助似乎也不大。parallel stream 要能發揮效果必須看資料的來源類型,不過要注意的是 parallel stream 也會使記憶體的使用量增加,使用上也要小心。
Thumbnail
老實說,看到 Java Sream API 讓我感到相當親切,這應該跟我研究所多年的研究題目是 visual dataflow language 有關,Java Stream API 把迴圈給內化了,每個 operation 的重點是要做什麼,大大提高了程式的抽象化程度和可讀性。
Thumbnail
老實說,看到 Java Sream API 讓我感到相當親切,這應該跟我研究所多年的研究題目是 visual dataflow language 有關,Java Stream API 把迴圈給內化了,每個 operation 的重點是要做什麼,大大提高了程式的抽象化程度和可讀性。
Thumbnail
最後,Java 8 雖然支援 Lambda,但我覺得 Closure 某種程度上還不稱不上是 Java 的第一級居民,我還是比較喜歡寫一些小而易測的 class,而不是使用 Lambda,至於捕捉變數,透過建構子將變數帶入物件也是一種方式。
Thumbnail
最後,Java 8 雖然支援 Lambda,但我覺得 Closure 某種程度上還不稱不上是 Java 的第一級居民,我還是比較喜歡寫一些小而易測的 class,而不是使用 Lambda,至於捕捉變數,透過建構子將變數帶入物件也是一種方式。
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News