Snowflake的使用
安装 requests
1
|
pip install requests
|
安装 pysnowflake
1
|
pip install pysnowflake
|
启动pysnowflake服务
1
2
3
4
5
6
|
snowflake_start_server \
—address=192.168.137.11 \
—port=30001 \
—dc=1 \
—worker=1 \
—log_file_prefix=/tmp/pysnowflask.log
|
–address:本机的IP地址默认localhost这里解释一下参数意思(可以通过–help来获取):
–dc:数据中心唯一标识符默认为0
–worker:工作者唯一标识符默认为0
–log_file_prefix:日志文件所在位置
使用示例(这边引用官网的)
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
|
# 导入pysnowflake客户端
>>> import snowflake.client
# 链接服务端并初始化一个pysnowflake客户端
>>> host = ‘192.168.137.11’
>>> port = 30001
>>> snowflake.client.setup(host, port)
# 生成一个全局唯一的ID(在MySQL中可以用BIGINT UNSIGNED对应)
>>> snowflake.client.get_guid()
3631957913783762945
# 查看当前状态
>>> snowflake.client.get_stats()
{
‘dc’: 1,
‘worker’: 1,
‘timestamp’: 1454126885629, # current timestamp for this worker
‘last_timestamp’: 1454126890928, # the last timestamp that generated ID on
‘sequence’: 1, # the sequence number for last timestamp
‘sequence_overload’: 1, # the number of times that the sequence is overflow
‘errors’: 1, # the number of times that clock went backward
}
|
数据整理重建ID
重建ID是一个很庞大的工程,首先要很了解表的结构。不然,如果少更新了某个表的一列都会导致数据的不一致。
当然,如果你的表中有很强的外键以及设置了级联那更新一个主键会更新其他相关联的外键。这里我还是不建议去依赖外键级联更新来投机取巧毕竟如果有数据库的设计在项目的里程碑中经过了n次变化,也不能肯定设置的外键一定是级联更新的。
在这边我强烈建议重建ID时候讲MySQL中的检查外键的参数设置为0。
1
|
SET FOREIGN_KEY_CHECKS=0;
|
小提示:其实理论上我们是没有必要重建ID的因为原来的ID已经是唯一的了而且是整型,他兼容BIGINT。但是这里我还是做了重建,主要是因为以后的数据一致。并且如果有些人的ID不是整型的,而是有一定含义的那时候也肯定需要做ID的重建。
修改相关表ID的数据类型为BIGINT
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
|
— 修改商品表 goods_id 字段
ALTER TABLE goods_1
MODIFY COLUMN goods_id BIGINT UNSIGNED NOT NULL
COMMENT ‘商品ID’;
— 修改出售订单表 goods_id 字段
ALTER TABLE sell_order_1
MODIFY COLUMN sell_order_id BIGINT UNSIGNED NOT NULL
COMMENT ‘出售订单ID’;
— 修改购买订单表 buy_order_id 字段
ALTER TABLE buy_order_1
MODIFY COLUMN buy_order_id BIGINT UNSIGNED NOT NULL
COMMENT ‘出售订单ID与出售订单相等’;
— 修改订单商品表 order_goods_id、orders_id、goods_id 字段
ALTER TABLE order_goods_1
MODIFY COLUMN order_goods_id BIGINT UNSIGNED NOT NULL
COMMENT ‘订单商品表ID’;
ALTER TABLE order_goods_1
MODIFY COLUMN sell_order_id BIGINT UNSIGNED NOT NULL
COMMENT ‘订单ID’;
ALTER TABLE order_goods_1
MODIFY COLUMN goods_id BIGINT UNSIGNED NOT NULL
COMMENT ‘商品ID’;
|
使用python重建ID
使用的python 模块:
模块名 | 版本 | 备注 |
pysnowflake | 0.1.3 | 全局ID生成器 |
mysql_connector_python | 2.1.3 | mysql python API |
这边只展示主程序:完整的程序在附件中都有
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
|
if __name__==‘__main__’:
# 设置默认的数据库链接参数
db_config = {
‘user’ : ‘root’,
‘password’: ‘root’,
‘host’ : ‘127.0.0.1’,
‘port’ : 3306,
‘database’: ‘test’
}
# 设置snowflake链接默认参数
snowflake_config = {
‘host’: ‘192.168.137.11’,
‘port’: 30001
}
rebuild = Rebuild()
# 设置数据库配置
rebuild.set_db_config(db_config)
# 设置snowflak配置
rebuild.set_snowflake_config(snowflake_config)
# 链接配置snowflak
rebuild.setup_snowflake()
# 生成数据库链接和
rebuild.get_conn_cursor()
##########################################################################
## 修改商品ID
##########################################################################
# 获得商品的游标
goods_sql = ”’
SELECT goods_id FROM goods
”’
goods_iter = rebuild.execute_select_sql([goods_sql])
# 根据获得的商品ID更新商品表(goods)和订单商品表(order_goods)的商品ID
for goods in goods_iter:
for (goods_id, ) in goods:
rebuild.update_table_id(‘goods’, ‘goods_id’, goods_id)
rebuild.update_table_id(‘order_goods’, ‘goods_id’, goods_id, rebuild.get_current_guid())
rebuild.commit()
##########################################################################
## 修改订单ID, 这边我们规定出售订单ID和购买订单ID相等
##########################################################################
# 获得订单的游标
orders_sql = ”’
SELECT sell_order_id FROM sell_order_1
”’
sell_order_iter = rebuild.execute_select_sql([orders_sql])
# 根据出售订单修改 出售订单(sell_order_1)、购买订单(buy_order_1)、订单商品(order_goods)的出售订单ID
for sell_order_1 in sell_order_iter:
for (sell_order_id, ) in sell_order_1:
rebuild.update_table_id(‘sell_order_1’, ‘sell_order_id’, sell_order_id)
rebuild.update_table_id(‘buy_order_1’, ‘buy_order_id’, sell_order_id, rebuild.get_current_guid())
rebuild.update_table_id(‘order_goods’, ‘sell_order_id’, sell_order_id, rebuild.get_current_guid())
rebuild.commit()
##########################################################################
## 修改订单商品表ID
##########################################################################
# 获得订单商品的游标
order_goods_sql = ”’
SELECT order_goods_id FROM order_goods
”’
order_goods_iter = rebuild.execute_select_sql([order_goods_sql])
for order_goods in order_goods_iter:
for (order_goods_id, ) in order_goods:
rebuild.update_table_id(‘order_goods’, ‘order_goods_id’, order_goods_id)
rebuild.commit()
# 关闭游标
rebuild.close_cursor(‘select’)
rebuild.close_cursor(‘dml’)
# 关闭连接
rebuild.close_conn()
|
完整的python程序:rebuild_id.py
执行程序
1
|
python rebuild_id.py
|
最后查看表的结果
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
|
SELECT * FROM goods LIMIT 0, 1;
+——————————–+——————+————–+—————+
| goods_id | goods_name | price | store_id |
+——————————–+——————+————–+—————+
| 3791337987775664129 | goods1 | 9369.00 | 1 |
+——————————–+——————+————–+—————+
SELECT * FROM sell_order_1 LIMIT 0, 1;
+——————————–+———————–+————–+————–+————+
| sell_order_id | user_guide_id | user_id | price | status |
+——————————–+———————–+————–+————–+————+
| 3791337998693437441 | 1 | 10 | 5320.00 | 1 |
+——————————–+———————–+————–+————–+————+
SELECT * FROM buy_order_1 LIMIT 0, 1;
+——————————–+————–+———————–+
| buy_order_id | user_id | user_guide_id |
+——————————–+————–+———————–+
| 3791337998693437441 | 10 | 1 |
+——————————–+————–+———————–+
SELECT * FROM order_goods LIMIT 0, 1;
+——————————–+——————————–+——————————–+———————–+————–+———+
| order_goods_id | sell_order_id | goods_id | user_guide_id | price | num |
+——————————–+——————————–+——————————–+———————–+————–+———+
| 3792076554839789569 | 3792076377064214529 | 3792076372429508609 | 1 | 9744.00 | 2 |
+——————————–+——————————–+——————————–+———————–+————–+———+
|
建议:如果在生产上有使用到snowflake请务必要弄一个高可用防止单点故障,具体策略看你们自己定啦。
文章转载来自:ttlsa.com