[Verilog] 再次征戰FIFO地獄 - (5) async fifo

出一張嘴

發佈於IC面試專班

2025/08/11 更新2025/08/11 發佈閱讀 9 分鐘

回到這張看起來很複雜的AFIFO架構圖 (*藍色訊號為write clk *紅色訊號為read clk)

我們開始來專心探討一下圖中B2G這區塊的功用

相信各位看懂架構後coding就不是甚麼大問題

回顧一下,

我們先思考ptr在傳輸時沒有處理CDC issue時會發生甚麼事?

ptr屬於一個multibits的訊號,

在2個clk domain間傳輸時會碰到一個問題,

每個bits之間從clkA到clkB的時間點不同,

clkB所驅動的reg並無法知道當前取樣的ptr訊號每個bits是否真實出現過這個.

如果不知道上述再說甚麼的話,可以回顧一下這篇文章

[Verilog] 10分鐘看懂CDC的2DFF

跨clk domain後所掛入的2DFF並沒辦法知道value是否正確,

他只能確保說後面抓到的訊號是strong 0或strong 1,

也就是說只要有個機制能讓clkB的reg取樣時確保value肯定沒錯,

那麼就解決了當前ptr傳遞所碰到的最大問題.

也就是當前gray code的應用

甚麼是gray code?為甚麼他可以讓value正確卻又不像2DFF隨處可見

如果真這麼強gray code綁2DFF應該早就要變成一個module變成跨CDC時使用的卍解,

但目前看下來卻好像不是如此,更詭異的是B2G後面還是掛了2DFF.

因此這邊再來介紹一下gray code

wiki上的簡介如下,gray code是對原先的數值做加密或轉換的一種方式,

將原先的binary表示的數值,改用另一種格式來表示,

並且在新的格式下每個相連數值間的差異都只有1個bit的改動.

看個實際的例子

二進位下 0->1 和gray 一樣都只有1個bit跳動

1->2: gray (001 -> 011) / bin (001 -> 010) ,

gray下只有bit[1] 由0變1,

在B2G output給2DFF時於前後幾個cycle內,有機會被取樣到的data為 {001 -> 001 -> 011 -> 011}

bin下則bit[1] 由 0變1 且 bit[0] 由1變0,總共有2個bits的跳動,於前後幾個cycle內

,有機會被取樣到的data則為 {001 -> 011 -> 010 -> 010} or {001 -> 000 -> 010 -> 010}.

因為每個bit抵達下一集reg的時間長短不同,

因此在bin下有機會被看到011 (3) 或000 (0) 這兩種可能在過程中根本還沒使用到或已經使用過的ptr被重新取樣,

這個行為將會破壞fifo的function,因為fifo的工作原理就是靠wptr先寫入data再將wptr update給read端, 假如wptr只寫到了2,理論上rptr最多就只能讀到2的位置,

但因為了multibits傳輸過程出現的暫態導致011 (3)被取樣到了,

read端就會以為write已經寫到3了,因此2,3都可以被讀取,

儘管下個cycle被修正回010好了,fifo操作也很有可能直接亂掉導致function break

然而在gray下,我們只有機會看到兩種001或011,

看到001 read端就只是以為還沒有任何update而已,看到011則發現write端update了可以多讀一筆出來,不會造成function上的誤判

一路往下看大致上就是這種概念

gray code下 0到1 1到2 2到3 ... 以及最後overflow導致的7到0,每個相鄰的數字都只有1個bit會動

但對於bin來看在overflow時7到0,會由111變成000 總共有3個bits同時需要做跳動,

在看完概念來總結一下,

其實gray code沒什麼就是一種新的數值表示方式,每個十進位的數值都可以對應到一個特定的數值,但他有一個特點,在十進位上相間的兩個數值在gray code下只會有一個bit會不一樣,我們將利用這個特性去解接下來所碰到的問題

由於我們在傳遞的data內容為pointer,
pointer有個特性是每次的操作都只會讓數值+1,

也就是說數值會這樣跳 0,1,2,3,4..7, 0,1,2,..7 依序的遞增到111後overflow成0再重複開始新的計數

也在有這個先前條件下,我們的gray code才有機會派上用場,

因為Data的源頭變化是有既定的rule的,

所以我們在這邊就可以來回答一下上面提出的疑問,

他好像可以讓value在傳遞時保持正確性,但是卻不是所有multibits傳輸時的通解,

因為必須在source data在這種有固定rule每次都只會執行+1的行為下才有機會work.

至於我們在gray code上解決的是multibits傳輸時多個bits跳躍的問題,

利用Gray code限制了我們在同一個時間下只會有1個bit的跳動,

但對於跨clk domain所導致的metastable的問題卻沒辦法被這個方式解決,

也就是說把問題限縮回了1bit CDC的題目,

因此在B2G後面的2DFF就是用來解決data跨wptr clk和rptr clk的問題

總結一下中間的ptr區塊在做甚麼?

1.將當前的wptr給予memory告知新的data要寫的位置,

並同時經gray code編譯後,傳遞給read ctrl端,

但這是一個由wclk跨rclk的操作,

因此需要再rclk端敲2T DFF做sync來消除metastable的問題,

再傳遞到read ctrl內給controller做判斷是否可繼續read data

2.將當前的rptr給予memory告知需拿取Data的位置,

並同時經gray code編譯後,傳遞給write ctrl端,

但這時是變成rclk跨wclk的操作,

因此需要利用wclk敲2T dff做sync後消除metastable的問題,

再傳遞給write ctrl內讓controller判斷是否可以繼續write新data

當我們好像理解ptr在幹嘛後,

面試官最喜歡考的題目就是,

雖然在使用gray code編譯後可以讓data每次的跳躍只有1bit,

讓我們在multibits傳輸時不會抓到那種沒出現過的暫態訊號,

但仔細想想,當write/read clk速度差很多的時候呢?

假如write寫了5次才有機會被read取樣到1次

這樣在read端看到的不是也是000 -> 111

一次同時有3個bits在跳動,這樣不就和binany一樣了嗎?

當你碰到這個問題也有同樣的困惑時就是因為你還沒感受到gray code的魅力

雖然read端看到了3個bits一起跳了,

但是我們限制了source端每次的update只能有1 bit

所以跟binary時source端每次update是沒限制是不同的

在我們都能保證source端每次update只有1bit時,

儘管sync的過程中看到了多bits翻轉造成的暫態,

這些暫態都一定是曾經出現過的合法value,

一切的Data在你decode回binary後都會發現ptr都<=當前合法的數字,

並不會像binary一樣才update到2卻讀到了3的位置,

因此當clk速度差很多時在gray code的保護下並不會造成function上的錯誤,

唯一會導致的就只是performance有機會會下降而已,

這個部分適合大家自己手寫模擬中間可能會出現的data,

就會發現gray code的奧妙.

留言

留言分享你的想法！

數位IC設計第一品牌

129會員

29內容數

數位IC設計第一品牌從0到1用嘴做IC 觀念大權

數位IC設計第一品牌的其他內容

2025/05/23

[Verilog] 再次征戰FIFO地獄 - (4) async fifo

上篇文中最後提到的為甚麼async不用Dmux傳ptr就好, 究竟有甚麼缺點又或是不可行, 這邊來探討一下. 首先我們先來看一下Dmux解CDC issue的原理 dmux架構可以分為兩個部分, Data path和CTRL path, 我們會在CTRL的path的部分在clkA的t

2025/05/23

[Verilog] 再次征戰FIFO地獄 - (4) async fifo

2025/05/16

[Verilog] 再次征戰FIFO地獄 - (3) async fifo

在了解sync fifo後,可以開始來研究一下何謂asyc fifo? 小弟在這邊盡量利用了sync fifo的架構圖來呈現async fifo的運作, 以方便各位更容易的理解其中的奧妙以Top view來看,基本上和sync fifo沒太大的不同, 最大的差異則是clk和rst長出了兩組

2025/05/16

[Verilog] 再次征戰FIFO地獄 - (3) async fifo

2025/05/09

[Verilog] 再次征戰FIFO地獄 - (2) sync fifo

前面介紹完sync fifo的function block用途後, 這篇開始來帶入code要怎麼implement. Full code: module sync_fifo #(parameter N=8, parameter depth=8) (input clk, input rst_

2025/05/09

[Verilog] 再次征戰FIFO地獄 - (2) sync fifo

前面介紹完sync fifo的function block用途後, 這篇開始來帶入code要怎麼implement. Full code: module sync_fifo #(parameter N=8, parameter depth=8) (input clk, input rst_

看更多

你可能也想看

方格子 vocus 官方沙龍

線上街訪直擊！雙 11 購物車大公開！

雙11於許多人而言，不只是單純的折扣狂歡，更是行事曆裡預定的，對美好生活的憧憬。錢錢沒有不見，它變成了快樂，跟讓臥房、辦公桌、每天早晨的咖啡香升級的樣子！這次格編突擊辦公室，也邀請 vocus「野格團」創作者分享掀開蝦皮購物車的簾幕，「加入購物車」的瞬間，藏著哪些靈感，或是對美好生活的想像？

#vocusforBusiness#雙11#蝦皮分潤計畫

2025/10/28

方格子 vocus 官方沙龍

線上街訪直擊！雙 11 購物車大公開！

#vocusforBusiness#雙11#蝦皮分潤計畫

2025/10/28

Chloe小窩

租屋整理控必看 | 雙11收納好物開箱 × 蝦皮分潤計畫

雙11購物節準備開跑，蝦皮推出超多優惠，與你分享實際入手的收納好物，包括貨櫃收納箱、真空收納袋、可站立筆袋等，並分享如何利用蝦皮分潤計畫，一邊購物一邊賺取額外收入，讓你買得開心、賺得也開心！

#蝦皮分潤計畫#蝦皮1111#蝦皮免運

2025/11/05

Chloe小窩

租屋整理控必看 | 雙11收納好物開箱 × 蝦皮分潤計畫

#蝦皮分潤計畫#蝦皮1111#蝦皮免運

2025/11/05

邊境牧羊犬的觀察筆記

開箱｜我為新家買的 5 樣家居好物！蝦皮購物實用選品

分享個人在新家裝潢後，精選 5 款蝦皮上的實用家居好物，包含客製化層架、MIT 地毯、沙發邊桌、分類垃圾桶及寵物碗架，從尺寸、功能到價格都符合需求，並提供詳細開箱心得與購買建議。

#蝦皮分潤計畫#蝦皮1111#蝦皮免運

2025/11/05

邊境牧羊犬的觀察筆記

開箱｜我為新家買的 5 樣家居好物！蝦皮購物實用選品

#蝦皮分潤計畫#蝦皮1111#蝦皮免運

2025/11/05

阿Han的沙龍

【🔒 Message Queue - Kafka】關於配置檔

我們在「【Message Queue - Kafka】不斷的試誤…, 用Docker來嘗試安裝Kafka」有介紹如何架設kafka，其中我們使用環境變數來進行kafka的配置，但除了環境變數之外，其實還能夠用檔案配置的方式來對kafka進行配置，如此一來我們就可以將配置檔與啟動檔完全分開，

2024/07/12

阿Han的沙龍

【🔒 Message Queue - Kafka】關於配置檔

2024/07/12

s_SoNg的沙龍

沒任務就停止，有任務就依序執行的小功能分享

在網路速度有限的情況下，依序記錄不斷產生的資訊，能統計使用者在頁面上操作了哪些功能。

#ThreeJs#React#javascript

2024/07/03

s_SoNg的沙龍

沒任務就停止，有任務就依序執行的小功能分享

在網路速度有限的情況下，依序記錄不斷產生的資訊，能統計使用者在頁面上操作了哪些功能。

#ThreeJs#React#javascript

2024/07/03

阿Han的沙龍

【🔒 Message Queue - Kafka】串流式的SQL - ksqlDB

KSQL引擎，串流形式的SQL？聽了應該霧煞煞吧！想像一下傳統的SQL，是不是一個指令一個動作，每發送一個指令之後就必須等到查詢/寫入…動作皆完成之後才回應，然而在Streaming的應用上這顯然不太可行，每分每秒都有資料流入的情境下，資料的狀態都在變化，假設我們一個指令一個動作，

#Kafka#ksql#MessageQueue

2024/06/30

阿Han的沙龍

【🔒 Message Queue - Kafka】串流式的SQL - ksqlDB

#Kafka#ksql#MessageQueue

2024/06/30

阿Han的沙龍

【🔒Message Queue - Kafka】Schema Registry EP.1 傳輸訊息的標準格式制定者

為什麼會有Schema Registry的出現？因為Kafka的零拷貝原則，也就是kafka本身並不會去碰觸到訊息也不進行資料驗證，而是bypass的傳送，預設都以位元組來傳輸資料會比較有效率，但位元組誰看得懂啊...。加上Kafka的特性是生產者與消費者並不能直接溝通，因

#Kafka#MessageQueue

2024/06/18

阿Han的沙龍

【🔒Message Queue - Kafka】Schema Registry EP.1 傳輸訊息的標準格式制定者

#Kafka#MessageQueue

2024/06/18

Youna's Devlog

[Lua] 檔案的用法

Lua 開檔寫檔的運用 io.output()...

2024/06/10

Youna's Devlog

[Lua] 檔案的用法

Lua 開檔寫檔的運用 io.output()...

2024/06/10

leqi.ai

提升效率：合併pdf文件的五個處理方法

#PDF轉換#pdftopdf#pdf合并

2024/05/31

leqi.ai

提升效率：合併pdf文件的五個處理方法

#PDF轉換#pdftopdf#pdf合并

2024/05/31

阿Han的沙龍

【🔒 Message Queue - Kafka】串流時代的超入門簡介

訊息的即時傳遞已然成為現代社會的趨勢了，而扮演中樞平台的系統架構功能也漸趨複雜完整， Kafka是一個事件流平台，正好滿足串流時代之下的即時訊息傳遞架構，因此我們有必要深入來學習這套事件流平台，不論是自動化、金融交易、IOT、物流…皆離不開即時的需求，所以就讓我們蹲好馬步來好好的學習一

#Kafka#MessageQueue#MQ

2024/05/17

阿Han的沙龍

【🔒 Message Queue - Kafka】串流時代的超入門簡介

#Kafka#MessageQueue#MQ

2024/05/17

周濡墨的沙龍

picoCTF - Static ain't always noise 實戰解析

熱騰騰的文章又來囉～在開始之前想先聊聊為甚麼我想些 picoCTF 這系列的文章。 St

#picoCTF#CTF#writeup

2024/05/09

周濡墨的沙龍

picoCTF - Static ain't always noise 實戰解析

熱騰騰的文章又來囉～在開始之前想先聊聊為甚麼我想些 picoCTF 這系列的文章。 St

#picoCTF#CTF#writeup

2024/05/09

鏟薯員的窩

無痛入手 C++：基礎教學3 - 程式的輸入與輸出

<iostream> 在之前的文章有提到過，<iostream> 是專門處理程式的輸入 (input) 以及輸出 (output) 的函式庫。輸入輸出的對象是以電腦作為主角: 輸入指的是「把資料給電腦」，輸出指的是「從電腦那邊取得資料」。在這個系列的文章中，程式輸入指的都是從鍵盤輸入資料給電

#程式#教學#入門

2024/04/24

鏟薯員的窩

無痛入手 C++：基礎教學3 - 程式的輸入與輸出

#程式#教學#入門

2024/04/24

追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News