snowflake做主键 自增_自增ID算法snowflake - C#版
急景流年,銅壺滴漏,時光繾綣如畫,歲月如詩如歌。轉(zhuǎn)載一篇博客來慰藉,易逝的韶華。
使用UUID或者GUID產(chǎn)生的ID沒有規(guī)則
Snowflake算法是Twitter的工程師為實(shí)現(xiàn)遞增而不重復(fù)的ID實(shí)現(xiàn)的
概述
分布式系統(tǒng)中,有一些需要使用全局唯一ID的場景,這種時候?yàn)榱朔乐笽D沖突可以使用36位的UUID,但是UUID有一些缺點(diǎn),首先他相對比較長,另外UUID一般是無序的。有些時候我們希望能使用一種簡單一些的ID,并且希望ID能夠按照時間有序生成。而twitter的snowflake解決了這種需求,最初Twitter把存儲系統(tǒng)從MySQL遷移到Cassandra,因?yàn)镃assandra沒有順序ID生成機(jī)制,所以開發(fā)了這樣一套全局唯一ID生成服務(wù)。
該項(xiàng)目地址為:https://github.com/twitter/snowflake是用Scala實(shí)現(xiàn)的。
python版詳見開源項(xiàng)目https://github.com/erans/pysnowflake。
結(jié)構(gòu)
snowflake的結(jié)構(gòu)如下(每部分用-分開):
0 - 0000000000 0000000000 0000000000 0000000000 0 - 00000 - 00000 - 000000000000
第一位為未使用,接下來的41位為毫秒級時間(41位的長度可以使用69年),然后是5位datacenterId和5位workerId(10位的長度最多支持部署1024個節(jié)點(diǎn)) ,最后12位是毫秒內(nèi)的計數(shù)(12位的計數(shù)順序號支持每個節(jié)點(diǎn)每毫秒產(chǎn)生4096個ID序號)
一共加起來剛好64位,為一個Long型。(轉(zhuǎn)換成字符串長度為18)
snowflake生成的ID整體上按照時間自增排序,并且整個分布式系統(tǒng)內(nèi)不會產(chǎn)生ID碰撞(由datacenter和workerId作區(qū)分),并且效率較高。據(jù)說:snowflake每秒能夠產(chǎn)生26萬個ID。
從圖上看除了第一位不可用之外其它三組均可浮動站位,據(jù)說前41位就可以支撐到2082年,10位的可支持1023臺機(jī)器,最后12位序列號可以在1毫秒內(nèi)產(chǎn)生4095個自增的ID。
在多線程中使用要加鎖。
看懂代碼前 先來點(diǎn)計算機(jī)常識:<
^異或 :true^true=false? ?false^false=false? true^false=true false^true=true? 例子:? 1001^0001=1000
負(fù)數(shù)的二進(jìn)制:
第一步:絕對值化為你需要多少位表示的二進(jìn)制
第二步:各位取反,0變1,1變0
第三步:最后面加1
例子:-1的二進(jìn)制→? ? ? 0001? 取反→1110→最后面加1→1111
好了廢話不多說 直接代碼:
public classIdWorker
{//機(jī)器ID
private static longworkerId;private static long twepoch = 687888001020L; //唯一時間,這是一個避免重復(fù)的隨機(jī)量,自行設(shè)定不要大于當(dāng)前時間戳
private static long sequence = 0L;private static int workerIdBits = 4; //機(jī)器碼字節(jié)數(shù)。4個字節(jié)用來保存機(jī)器碼(定義為Long類型會出現(xiàn),最大偏移64位,所以左移64位沒有意義)
public static long maxWorkerId = -1L ^ -1L << workerIdBits; //最大機(jī)器ID
private static int sequenceBits = 10; //計數(shù)器字節(jié)數(shù),10個字節(jié)用來保存計數(shù)碼
private static int workerIdShift = sequenceBits; //機(jī)器碼數(shù)據(jù)左移位數(shù),就是后面計數(shù)器占用的位數(shù)
private static int timestampLeftShift = sequenceBits + workerIdBits; //時間戳左移動位數(shù)就是機(jī)器碼和計數(shù)器總字節(jié)數(shù)
public static long sequenceMask = -1L ^ -1L << sequenceBits; //一微秒內(nèi)可以產(chǎn)生計數(shù),如果達(dá)到該值則等到下一微秒在進(jìn)行生成
private long lastTimestamp = -1L;///
///機(jī)器碼///
///
public IdWorker(longworkerId)
{if (workerId > maxWorkerId || workerId < 0)throw new Exception(string.Format("worker Id can't be greater than {0} or less than 0", workerId));
IdWorker.workerId=workerId;
}public longnextId()
{lock (this)
{long timestamp =timeGen();if (this.lastTimestamp ==timestamp)
{//同一微秒中生成ID
IdWorker.sequence = (IdWorker.sequence + 1) & IdWorker.sequenceMask; //用&運(yùn)算計算該微秒內(nèi)產(chǎn)生的計數(shù)是否已經(jīng)到達(dá)上限
if (IdWorker.sequence == 0)
{//一微秒內(nèi)產(chǎn)生的ID計數(shù)已達(dá)上限,等待下一微秒
timestamp = tillNextMillis(this.lastTimestamp);
}
}else{//不同微秒生成ID
IdWorker.sequence = 0; //計數(shù)清0
}if (timestamp
{//如果當(dāng)前時間戳比上一次生成ID時時間戳還小,拋出異常,因?yàn)椴荒鼙WC現(xiàn)在生成的ID之前沒有生成過
throw new Exception(string.Format("Clock moved backwards. Refusing to generate id for {0} milliseconds",this.lastTimestamp -timestamp));
}this.lastTimestamp = timestamp; //把當(dāng)前時間戳保存為最后生成ID的時間戳
long nextId = (timestamp - twepoch << timestampLeftShift) | IdWorker.workerId << IdWorker.workerIdShift |IdWorker.sequence;returnnextId;
}
}///
///獲取下一微秒時間戳///
///
///
private long tillNextMillis(longlastTimestamp)
{long timestamp =timeGen();while (timestamp <=lastTimestamp)
{
timestamp=timeGen();
}returntimestamp;
}///
///生成當(dāng)前時間戳///
///
private longtimeGen()
{return (long)(DateTime.UtcNow - new DateTime(1970, 1, 1, 0, 0, 0, DateTimeKind.Utc)).TotalMilliseconds;
}
}
調(diào)用:
IdWorker idworker = new IdWorker(1);for (int i = 0; i < 1000; i++)
{
Console.WriteLine(idworker.nextId());
}
其他算法:
方法一:UUID
UUID是通用唯一識別碼 (Universally Unique Identifier),在其他語言中也叫GUID,可以生成一個長度32位的全局唯一識別碼。
String uuid = UUID.randomUUID().toString()
結(jié)果示例:
046b6c7f-0b8a-43b9-b35d-6489e6daee91
為什么無序的UUID會導(dǎo)致入庫性能變差呢?
這就涉及到?B+樹索引的分裂:
眾所周知,關(guān)系型數(shù)據(jù)庫的索引大都是B+樹的結(jié)構(gòu),拿ID字段來舉例,索引樹的每一個節(jié)點(diǎn)都存儲著若干個ID。
如果我們的ID按遞增的順序來插入,比如陸續(xù)插入8,9,10,新的ID都只會插入到最后一個節(jié)點(diǎn)當(dāng)中。當(dāng)最后一個節(jié)點(diǎn)滿了,會裂變出新的節(jié)點(diǎn)。這樣的插入是性能比較高的插入,因?yàn)檫@樣節(jié)點(diǎn)的分裂次數(shù)最少,而且充分利用了每一個節(jié)點(diǎn)的空間。
但是,如果我們的插入完全無序,不但會導(dǎo)致一些中間節(jié)點(diǎn)產(chǎn)生分裂,也會白白創(chuàng)造出很多不飽和的節(jié)點(diǎn),這樣大大降低了數(shù)據(jù)庫插入的性能。
方法二:數(shù)據(jù)庫自增主鍵
假設(shè)名為table的表有如下結(jié)構(gòu):
id????????feild
35????????a
每一次生成ID的時候,訪問數(shù)據(jù)庫,執(zhí)行下面的語句:
begin;
REPLACE INTO table ( feild )? VALUES ( 'a' );
SELECT LAST_INSERT_ID();
commit;
REPLACE INTO 的含義是插入一條記錄,如果表中唯一索引的值遇到?jīng)_突,則替換老數(shù)據(jù)。
這樣一來,每次都可以得到一個遞增的ID。
為了提高性能,在分布式系統(tǒng)中可以用DB proxy請求不同的分庫,每個分庫設(shè)置不同的初始值,步長和分庫數(shù)量相等:
這樣一來,DB1生成的ID是1,4,7,10,13....,DB2生成的ID是2,5,8,11,14.....
總結(jié)
以上是生活随笔為你收集整理的snowflake做主键 自增_自增ID算法snowflake - C#版的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
                            
                        - 上一篇: 闪灯什么意思_开夜车被对方闪了一下是什么
 - 下一篇: 2019浙江C语言二级答案,2019年下