【資料庫寶典 - MongoDB】併發進行Upsert造成重複資料。

2023/05/01 更新2023/05/01 發佈閱讀 3 分鐘

通常我們如果希望一筆資料是能夠具備唯一性的狀況下，勢必在新增前會進行檢查，但是在我們的應用程式中，先查詢再寫入勢必會造成一些時間差，導致於多人同時操作時，可能發生重複資料的狀況。

假設我們的應用是不允許名稱重複，那我們的資料可能如下：

[
  {
    "name": "john",
		"phone": "0911111111"
  },
  {
    "name": "mark",
		"phone": "0922222222"
  }
]

我們的業務邏輯為「當名稱存在時就更新、不存在就新增」，此時我們可能會分成兩個動作來操作：

查詢 name = xxx。
存在： Update、不存在： Insert。

上述狀況在同一時間內只有一個操作都不會發生問題，但假設同一個時間點有兩個人同時操作時，就可能發生以下狀況：

而為了解決上述問題，我們可以把「查詢/新增/更新」這個動作視為一個單元，提交給DB去幫我們操作，也就是透過Upsert的指令來幫我們完成。

但實測後發現在高併發的狀況下，雖然重複資料的狀況減少了，但仍然會發生，若要完全避免這樣的況狀發生，根據官方的描述：

「To avoid multiple upserts, ensure that the filter field(s) are uniquely indexed. 」(https://docs.mongodb.com/manual/reference/method/db.collection.updateOne/)

要解決這個問題，我們可以透過「唯一索引」的方式來建立，以上面的例子來說，我們的name，就是這個文檔的唯一性關鍵，因此我們可以對name進行建立Unique索引：

db.collection.createIndex( { "name": 1 }, { unique: true } )

會解決以下兩個問題：

只要欲更新/新增的name會有重複的狀況發生時，就會被DB Reject。
併發的狀況下，假設同時有兩個一模一樣的upsert在同時間操作，如下：

db.collection.update(
	{
		"name": "Ada"
	}, 
	{ 
		"$set": { 
			"name": "Ada", "phone": "0933333333"
		}
	}
)db.collection.update(
	{
		"name": "Ada"
	}, 
	{ 
		"$set": { 
			"name": "Ada", "phone": "0933333333"
		}
	}
)

#資料庫

#database

#MongoDB

阿Han的沙龍阿Han的軟體技術棧 💡資料庫

留言

阿Han的沙龍

155會員

330內容數

哈囉，我是阿Han，是一位 👩‍💻 軟體研發工程師，喜歡閱讀、學習、撰寫文章及教學，擅長以圖代文，化繁為簡，除了幫助自己釐清思路之外，也希望藉由圖解的方式幫助大家共同學習，甚至手把手帶您設計出高品質的軟體產品。

阿Han的沙龍的其他內容

2023/08/08

【資料庫寶典 - MongoDB】基礎介紹

我們在「【資料庫寶典】什麼是NoSQL？能吃嗎？」有談到一些NoSQL的特性，雖然本質上有所差異，但兩方技術發展的產品也都開始互相支援了，比如說MongoDB後來也發展出類SQL語法讓熟悉SQL的開發者可以降低進入門檻，而SQL、postgresql…等也紛紛納入一些NoSQL的元素，雙方都有開始接