閒談軟體設計:內部函式庫

更新於 發佈於 閱讀時間約 7 分鐘
圖片來源:https://versitas.com/using-building-blocks-word/

圖片來源:https://versitas.com/using-building-blocks-word/

今年 (2016) 因為轉職,特休歸零了,一年一度跟家人的國外旅遊也就暫緩,只有安排短短的宜蘭兩天一夜的小旅行,宜蘭雖然去過不少次,但這次幾個點都蠻不錯的,算是有個小小的充電,但…總覺得少了些什麼?

從小地方開始

上一回閒談軟體設計:API Naming Style提到在開發 framework 或 library 時,naming style 是很重要的,有一致且達意的 API 讓使用 framework 或 library 的開發者不會有意外感,容易上手。但可惜的是自動化工具能檢查格式 (縮排、空白等等),但無法幫忙判斷這個變數名稱好不好或是這個函式名稱達不達意,也許哪一天,將人工智慧用來判斷程式碼的 naming style 也許是個不錯的研究方向。

當公司的規模越來越大,開發的項目變多變大時,總是會出現在不同的專案但卻開發重複的東西,因此,公司內部的 library 或 framework 就會出現,一般來說,這些內部 library 或 framework 不會一開始就是 open-source 的形式出現在 Maven Central RepositoryJCenternpm 或 GitHub 中。除了牽涉到公司利益的問題外,即使要開放,也會是等到內部使用一陣子後,API 有一定的穩定度後,才會釋出,例如 okhttp 原先是 Square 的內部眾多 library 的其中一個,然後回饋給 open-source 社群,類似的例子還蠻多的,像是 Cassandra 原本也是 Facebook 的內部專案。

勤加管理

一旦公司內開始有內部函式庫,某種程度需要一些管理,確保不會花兩倍的人力開發相似的東西,或是避免開發的東西沒人知道。之前曾聽在硬體公司的軟體部門的人聊過,公司內部的 (韌體相關) 函式庫沒有進版控系統,可能聽誰說有什麼可以用,於是找主管複製,然後在自己的專案裡一起編譯,因為沒有人維護這些函式庫,踩到雷也只在自己的專案裡東修西修,沒有任何回報機制,頂多是自己保留一份修正版本,下次要用時就用自己的版本。又或者是,不斷地複製 (分支) 然後根據專案的需要修改,到最後函式庫有眾多個不同版本,完全不知道哪個版本才是最新最完整的,最後,沒人想用這些函式庫。

沒人維護公司內部函式庫是很常見的一種情況,因為專案或產品的產出才是能賺錢的部分,函式庫只是開發過程中,附帶的產物,當初貢獻的工程師可能在忙別的專案或產品,公司也不太可能讓這工程師變成專職維護內部函式庫的工程師。所以,最起碼內部函式庫要進到版控系統,如果要修改,要在版控系統上建立分支,並留下 commit,如果哪天真的要整理函式庫,還能透過版控系統進行比較 (compare) 與合併 (merge),更進一步還能進行函式庫版本控管,如果沒有版控系統,程式碼只是各自電腦中的一個目錄,那要整理就會是一件很困難的事了。

當整個公司 share 同一個 code base 時,內部函式庫被頻繁使用的情況下,就比較不會有無人維護的情況,但要進行設計上的改版,就可能會引發公司內的政治問題,例如,一個內部函式庫 X,同時被 A 及 B 兩個專案使用,一開始可能都沒問題,但 A 專案的工程師想對 X 針對專案的需要進行設計上的調整,B 專案的工程師也想對 X 做一些針對 B 專案的調整,若兩者的設計不相違背,那是最理想的情況,但有衝突時,就需要有人出面協調,可能是原 X 函式庫的開發者或是主導整個公司技術的負責人。

版本控管

不論是採用哪種方式進行改版,有使用到 X 函式庫的其他專案都可能會受到影響,所以,務必要做好函式庫的版本控管,至少讓其他專案能有使用既有版本的選擇。相較於直譯式語言,只需要做好程式碼的版本控管即可。編譯式語言或是能以 binary 形式 (像是副檔名為 libdllsoa 或 jar 的檔案) 使用函式庫的語言,函式庫的版本控管就多了一個東西要管理,也就是 binary 檔案的版本控管。雖然說,有原始碼就能夠重建這些 binary 檔案,但有些情況會盡可能避免重建這些檔案:

  • 編譯時間太長,若編譯一個 so 需要五分鐘,使用到多個 so 檔可能會花上半小時,這太花時間了
  • 編譯環境,編譯函式庫可能需要一些環境,但不見得和專案的開發環境相同,若已經有 binary 檔案,可以省去一些設定開發環境的麻煩

目前大多數的語言生態系中都有 binary 層級或是 source code 層級的函式庫版本管理系統,以 Java 來說,想在公司內管理內部函式庫,可以使用 Artifactory,透過 CI 的協助,在程式碼有變動時,可以建置、測試,然後部署新版的 binary 檔案到 Artifactory 的檔案庫 (repository) 中,就能夠在 Maven 的 pom 檔或是在 Gradle 的腳本檔中使用。

其他考量

內部函式庫雖然可以幫公司省去不少開發重複東西的時間,但內部函式庫也是有一些缺點存在的。首先,一個專案中內部函式庫使用的量,會影響一個剛加入專案的新人了解專案架構的速度,使用的函式庫越多,特別是 framework 層級的函式庫,常會讓專案的程式邏輯散落在很多與 framework 有關的物件中,程式流程會較難以理解,可能會造成只知道如何撰寫特定程式加到 framework 中完成指定的功能,但整個專案的架構不熟悉,要解決要深入的問題時,就不知從何下手。

再者,是相依性問題,專案相依在許多內部函式庫時,若每個內部函式庫都很穩定,那專案應該會很容易在巨人的肩膀上專注在專案的功能上,但若有一兩個內部函式庫不是那麼穩定時,一出錯常常要找半天還不能確定是專案的問題或是某個內部函式庫的問題。

第三是部署或發佈可能會是一個問題,若公司是以產品為主,那這問題就比較好處理,但如果專案是一個接進來的外包案,內部函式庫的發佈就比較麻煩一點,直譯式語言只能將內部函式庫以原始碼的方式交給業主 (有其他方式嗎?),但即使是 binary 形式,在發佈的版本中,建置腳本需要一些特別的調整,總不能讓業主能直接連進公司內取得 binary 檔吧。

樂於分享

即使有上述幾個問題,但以長遠的角度來看,內部函式庫還是值得投資的公司資產,只是它需要時間、人力與管理才能做得好。若有不錯的內部函式庫其實也可以回饋給 open-source 社群,畢竟,現在開發軟體已經不太可能沒有用到任何 open-source 的東西了。回饋的形式有很多種,雖然說是將公司資產以 open-source 釋出,但換取的利益卻不見得是零,像是提升公司的聲望,在招募時能有更好的人才願意進來;獲得 open-source 社群的再貢獻,讓函式庫變得更好等等。話雖如此,但釋出時,還是要妥善選擇授權條款。


這是過去的舊文,本來應該是由三篇文章組成一個系列,可是後來一直沒空把第三篇文章寫完,看來是該找個時間把第三篇寫完,不過就在最近,Java Magazine 上有篇相關的好文章《設計與實作一個函式庫》,值得推薦。
avatar-img
53會員
104內容數
這是從 Medium 開始的一個專題,主要是想用輕鬆閒談的方式,分享這幾年軟體開發的心得,原本比較侷限於軟體架構,但這幾年的文章不僅限於架構,也聊不少流程相關的心得,所以趁換平台,順勢換成閒談軟體設計。
留言0
查看全部
avatar-img
發表第一個留言支持創作者!
Spirit的沙龍 的其他內容
在上回,探討 WIP Limit 的設置,但如果當被 WIP Limit 卡住時,直覺的想法是放寬 WIP Limit 而不是想著如何協助他人讓工作順利完成,那就失去使用看板方法的意義了,這回將探討如何讓團隊自覺與改善。
整結來說,受到幾種語言的影響,我個人設計 API 時,除了合乎該語言的 convention、上述的穩定性及一致性外,大致還會注意幾點:語意清楚、相近的顆粒度、簡單的文件、讓程式能像文章般閱讀。
在上回,我們已經把工作視覺化成看板,但這只是第一步,要想用看板方法優化工作的流程,我們得設置 WIP 限制,讓團隊開始知道瓶頸在哪裡,然後才能開始改善,這一回就來看 WIP 限制的設置。
意外的是這本書中提到蠻多首席設計師或是架構師的重要性,他確保系統的概念整體性,定義規格但對實作持開放讓開發者能夠發揮創意,自己的工作經驗中,第一份工作有和一位頗厲害的架構師合作過,第二份工作後來自己也當上架構師,甚至在另一家公司還曾經有過首席架構師的頭銜,但說實話,自己仍在摸索怎麼當一個好的架構師?
這本書裡很多的內容是寫於千禧年世代,現在回頭看很多內容的發展方向已經大不相同,像是訂閱制慢慢開始興起,App 在手機上崛起,Web 大鳴大放,但讀起來還是很有滋味,很推薦給大家。
第三方套件用了Promise或是Reactive,導致所有business logic都要做調整,這就違反「只能有對內的相依方向」的原則。business logic大多數情況下與效能優化無關,通常需要優化的是I/O的存取,這些既然都在外層,就應該在外層做優化,外層的優化不該影響核心,這才是好架構。
在上回,探討 WIP Limit 的設置,但如果當被 WIP Limit 卡住時,直覺的想法是放寬 WIP Limit 而不是想著如何協助他人讓工作順利完成,那就失去使用看板方法的意義了,這回將探討如何讓團隊自覺與改善。
整結來說,受到幾種語言的影響,我個人設計 API 時,除了合乎該語言的 convention、上述的穩定性及一致性外,大致還會注意幾點:語意清楚、相近的顆粒度、簡單的文件、讓程式能像文章般閱讀。
在上回,我們已經把工作視覺化成看板,但這只是第一步,要想用看板方法優化工作的流程,我們得設置 WIP 限制,讓團隊開始知道瓶頸在哪裡,然後才能開始改善,這一回就來看 WIP 限制的設置。
意外的是這本書中提到蠻多首席設計師或是架構師的重要性,他確保系統的概念整體性,定義規格但對實作持開放讓開發者能夠發揮創意,自己的工作經驗中,第一份工作有和一位頗厲害的架構師合作過,第二份工作後來自己也當上架構師,甚至在另一家公司還曾經有過首席架構師的頭銜,但說實話,自己仍在摸索怎麼當一個好的架構師?
這本書裡很多的內容是寫於千禧年世代,現在回頭看很多內容的發展方向已經大不相同,像是訂閱制慢慢開始興起,App 在手機上崛起,Web 大鳴大放,但讀起來還是很有滋味,很推薦給大家。
第三方套件用了Promise或是Reactive,導致所有business logic都要做調整,這就違反「只能有對內的相依方向」的原則。business logic大多數情況下與效能優化無關,通常需要優化的是I/O的存取,這些既然都在外層,就應該在外層做優化,外層的優化不該影響核心,這才是好架構。
你可能也想看
Google News 追蹤
Thumbnail
隨著理財資訊的普及,越來越多台灣人不再將資產侷限於台股,而是將視野拓展到國際市場。特別是美國市場,其豐富的理財選擇,讓不少人開始思考將資金配置於海外市場的可能性。 然而,要參與美國市場並不只是盲目跟隨標的這麼簡單,而是需要策略和方式,尤其對新手而言,除了選股以外還會遇到語言、開戶流程、Ap
Thumbnail
嘿,大家新年快樂~ 新年大家都在做什麼呢? 跨年夜的我趕工製作某個外包設計案,在工作告一段落時趕上倒數。 然後和兩個小孩過了一個忙亂的元旦。在深夜時刻,看到朋友傳來的解籤網站,興致勃勃熬夜體驗了一下,覺得非常好玩,或許有人玩過了,但還是想寫上來分享紀錄一下~
儲存庫 (Repository) 是檔案(File)的儲存區域。 在版本控制中,儲存庫是包含所有檔案的資料夾[1]。 每次改動檔案,你都可以選擇要不要儲存。 而那些有被處存的改動,就被稱為「提交 Commit」[2]。 而當一個儲存庫有多個開發者(Developer)在貢獻,
Thumbnail
※ OPP第一大核心-封裝 封裝的精神在於將「方法」、「屬性」和「邏輯」包裝在類別裡面,透過類別的實例來實現。這樣外部物件不需要了解內部的實現細節,只需要知道如何使用該類別提供的接口即可。換句話說,封裝是將內部細節隱藏起來,只暴露必要的部分給使用者。 封裝的核心概念是,使用者如果想要接觸資料,只
Thumbnail
本章講述了C#開發中的程序集,命名空間和 NuGet 包管理器。程序集是 .NET 應用的基礎,命名空間用於組織和預防命名衝突,而 NuGet 用於管理 .NET 的外部庫和依賴項。
Thumbnail
軟體系統的發展歷程大多相似,首重解決基本需求、提供操作介面,進而提升安全性、擴充功能、優化操作。
※ 什麼是資料庫正規化?為什麼需要正規化? 什麼是資料庫正規化? 資料庫正規化是一種設計關聯式資料庫的方法,目的是建立良好結構的關聯表,主要目的有二: 去除重複性:建立沒有重複的關聯表。因為重複資料不只浪費資料庫的儲存空間,而且會產生資料維護上的問題。 去除不一致的相依性:資料相依是指關聯表
Thumbnail
確保沒有遺漏或錯誤 程式的完整資訊資料對於程式設計至關重要。這是因為只有透過完整的資訊,我們才能確保在程式設計中沒有任何遺漏或錯誤。最終,後台管理扮演著管理系統中所有動作和行為是否符合特定標準的重要角色。 採取不符合預期的行動 這種符合性的重要性在於,當我們設計程式時,希望使用者按照預期的方式
Thumbnail
資料的統合 在程式設計中,其他人通常關心是否注意到執行的細節。作為程式設計師,主要應該關心的是程式的表現,但往往忽略了很多細節,這些細節可以決定程式的好壞。程式的好壞很大程度上取決於資料的統合,也就是資料是否被正規化。 不同類型的資料在系統中呈現一致 正規化可能對一些人來說聽起來很抽象,有些人
Thumbnail
先來幫大家複習一下我的轉職歷程,簡短來說,我是先到了一間軟體公司負責軟體的中英翻譯、行銷,讓我對打造軟體產品起了濃厚的興趣。 轉職前端後,我在台灣北部知名的接案公司待了一年半,後續開啟我的自有產品開發之路,以撰寫文章當下的現狀來說,我在一間台灣知名老牌的財經平台寫了八個月的軟體產品後,投入到⋯⋯
Thumbnail
為什麼開源是技術領域最關鍵的趨勢? 開源對加密貨幣、人工智慧 以及傳統軟體和技術企業有什麼影響? 幸福課程 幸福教練黃老師 潮資訊媒體 社群編輯 開源:技術領域最關鍵的趨勢? 開源為何如此重要? #開源是一種軟件開發理念和授權方式, 其核心是將軟件原始碼公開, 供任
物件導向設計的一個重點就是封裝,這有很多層面上的意義,但基本上就是控制物件的成員變數和方法的存取權。物件導向的封裝還跟繼承機制有關,這使得有一些時候我們逼不得已必須把函式定義在類別上,這種做法使得物件的功能變得難以拆解。封裝應該是模組的職責,並不需要再給物件相同的能力。 一般的模組系統就是把相
Thumbnail
隨著理財資訊的普及,越來越多台灣人不再將資產侷限於台股,而是將視野拓展到國際市場。特別是美國市場,其豐富的理財選擇,讓不少人開始思考將資金配置於海外市場的可能性。 然而,要參與美國市場並不只是盲目跟隨標的這麼簡單,而是需要策略和方式,尤其對新手而言,除了選股以外還會遇到語言、開戶流程、Ap
Thumbnail
嘿,大家新年快樂~ 新年大家都在做什麼呢? 跨年夜的我趕工製作某個外包設計案,在工作告一段落時趕上倒數。 然後和兩個小孩過了一個忙亂的元旦。在深夜時刻,看到朋友傳來的解籤網站,興致勃勃熬夜體驗了一下,覺得非常好玩,或許有人玩過了,但還是想寫上來分享紀錄一下~
儲存庫 (Repository) 是檔案(File)的儲存區域。 在版本控制中,儲存庫是包含所有檔案的資料夾[1]。 每次改動檔案,你都可以選擇要不要儲存。 而那些有被處存的改動,就被稱為「提交 Commit」[2]。 而當一個儲存庫有多個開發者(Developer)在貢獻,
Thumbnail
※ OPP第一大核心-封裝 封裝的精神在於將「方法」、「屬性」和「邏輯」包裝在類別裡面,透過類別的實例來實現。這樣外部物件不需要了解內部的實現細節,只需要知道如何使用該類別提供的接口即可。換句話說,封裝是將內部細節隱藏起來,只暴露必要的部分給使用者。 封裝的核心概念是,使用者如果想要接觸資料,只
Thumbnail
本章講述了C#開發中的程序集,命名空間和 NuGet 包管理器。程序集是 .NET 應用的基礎,命名空間用於組織和預防命名衝突,而 NuGet 用於管理 .NET 的外部庫和依賴項。
Thumbnail
軟體系統的發展歷程大多相似,首重解決基本需求、提供操作介面,進而提升安全性、擴充功能、優化操作。
※ 什麼是資料庫正規化?為什麼需要正規化? 什麼是資料庫正規化? 資料庫正規化是一種設計關聯式資料庫的方法,目的是建立良好結構的關聯表,主要目的有二: 去除重複性:建立沒有重複的關聯表。因為重複資料不只浪費資料庫的儲存空間,而且會產生資料維護上的問題。 去除不一致的相依性:資料相依是指關聯表
Thumbnail
確保沒有遺漏或錯誤 程式的完整資訊資料對於程式設計至關重要。這是因為只有透過完整的資訊,我們才能確保在程式設計中沒有任何遺漏或錯誤。最終,後台管理扮演著管理系統中所有動作和行為是否符合特定標準的重要角色。 採取不符合預期的行動 這種符合性的重要性在於,當我們設計程式時,希望使用者按照預期的方式
Thumbnail
資料的統合 在程式設計中,其他人通常關心是否注意到執行的細節。作為程式設計師,主要應該關心的是程式的表現,但往往忽略了很多細節,這些細節可以決定程式的好壞。程式的好壞很大程度上取決於資料的統合,也就是資料是否被正規化。 不同類型的資料在系統中呈現一致 正規化可能對一些人來說聽起來很抽象,有些人
Thumbnail
先來幫大家複習一下我的轉職歷程,簡短來說,我是先到了一間軟體公司負責軟體的中英翻譯、行銷,讓我對打造軟體產品起了濃厚的興趣。 轉職前端後,我在台灣北部知名的接案公司待了一年半,後續開啟我的自有產品開發之路,以撰寫文章當下的現狀來說,我在一間台灣知名老牌的財經平台寫了八個月的軟體產品後,投入到⋯⋯
Thumbnail
為什麼開源是技術領域最關鍵的趨勢? 開源對加密貨幣、人工智慧 以及傳統軟體和技術企業有什麼影響? 幸福課程 幸福教練黃老師 潮資訊媒體 社群編輯 開源:技術領域最關鍵的趨勢? 開源為何如此重要? #開源是一種軟件開發理念和授權方式, 其核心是將軟件原始碼公開, 供任
物件導向設計的一個重點就是封裝,這有很多層面上的意義,但基本上就是控制物件的成員變數和方法的存取權。物件導向的封裝還跟繼承機制有關,這使得有一些時候我們逼不得已必須把函式定義在類別上,這種做法使得物件的功能變得難以拆解。封裝應該是模組的職責,並不需要再給物件相同的能力。 一般的模組系統就是把相