当前位置: 首页 > 编程笔记 >

Mysql数据表分区技术PARTITION浅析

微生鸿轩
2023-03-14
本文向大家介绍Mysql数据表分区技术PARTITION浅析,包括了Mysql数据表分区技术PARTITION浅析的使用技巧和注意事项,需要的朋友参考一下

在这一章节里, 我们来了解下 Mysql 中的分区技术 (RANGE, LIST, HASH)
 
Mysql 的分区技术与水平分表有点类似, 但是它是在逻辑层进行的水平分表, 对于应用而言它还是一张表, 换句话说: 分区不是实际真正的对一张表进行拆分,分区之后表还是一个表,它是把存储文件进行拆分。

在 Mysql 5.1(后) 有了几种分区类型:
 
RANGE分区: 基于属于一个给定连续区间的列值, 把多行分配给分区

LIST分区: 类似于按 RANGE 分区, 区别在于 LIST 分区是基于列值匹配一个离散值集合中的某个值来进行选择

HASH分区: 基于用户定义的表达式的返回值来进行选择分区, 该表达式使用将要插入到表中的这些行的列值进行计算, 这个函数可以包含 Mysql 中有效的、产生非负整数值的任何表达式

KEY分区: 累世于按 HASH 分区, 区别在于 KEY 分区只支持计算一列或多列, 且 Mysql 服务器提供其自身的哈希函数
 
分区应该注意的事项:

1、 做分区时,要么不定义主键,要么把分区字段加入到主键中
2、 分区字段不能为NULL,要不然怎么确定分区范围呢,所以尽量 NOT NULL
 
首先你可以查看下你的 Mysql 版本是否支持 PARTITION


mysql> show plugins;

 

| partition    | ACTIVE   | STORAGE ENGINE     | NULL    | GPL     |


或者:
 

mysql> show variables like "%part%"; 

 

+-------------------+-------+

| Variable_name     | Value |

+-------------------+-------+

| have_partitioning | YES   |

+-------------------+-------+


RANGE 分区
 
假定你创建了一个如下的表, 该表保存有20家音像店的职员记录, 这20家音像店的编号从1到20。 如果你想将其分成4个小分区, 那么你可以采用RANGE分区, 创建的数据库表如下:

mysql-> CREATE TABLE employees (

     ->     id INT NOT NULL,

     ->     fname VARCHAR(30),

     ->     lname VARCHAR(30),

     ->     hired DATE NOT NULL DEFAULT '1970-01-01',

     ->     separated DATE NOT NULL DEFAULT '9999-12-31',

     ->     job_code INT NOT NULL,

     ->     store_id INT NOT NULL

     -> ) ENGINE=Myisam DEFAULT CHARSET=utf8

     -> PARTITION BY RANGE (store_id) (

     ->     PARTITION P0 VALUES LESS THAN (6),

     ->     PARTITION P1 VALUES LESS THAN (11),

     ->     PARTITION P2 VALUES LESS THAN (16),

     ->     PARTITION P3 VALUES LESS THAN (21)

     -> );

如果你想把不同时期离职的员工进行分别存储, 那么你可以将日期字段 separated (即离职时间) 作为一个 key, 创建的 SQL 语句如下:

mysql-> CREATE TABLE employees (

     ->     id INT NOT NULL,

     ->     fname VARCHAR(30),

     ->     lname VARCHAR(30),

     ->     hired DATE NOT NULL DEFAULT '1970-01-01',

     ->     separated DATE NOT NULL DEFAULT '9999-12-31',

     ->     job_code INT NOT NULL,

     ->     store_id INT NOT NULL

     -> ) ENGINE=Myisam DEFAULT CHARSET=utf8

     -> PARTITION BY RANGE (YEAR(separated)) (

     ->     PARTITION P0 VALUES LESS THAN (2001),

     ->     PARTITION P1 VALUES LESS THAN (2011),

     ->     PARTITION P2 VALUES LESS THAN (2021),

     ->     PARTITION P3 VALUES LESS THAN MAXVALUE

     -> );

 
List 分区
 
同样的例子, 如果这20家影像店分布在4个有经销权的地区,

+------------------+--------------------------------------+

| 地区             | 音像店 ID 号                         |

+------------------+--------------------------------------+

| 北区             | 3, 5, 6, 9, 17                       |

| 东区             | 1, 2, 10, 11, 19, 20                 |

| 西区             | 4, 12, 13, 14, 18                    |

| 中心区           | 7, 8, 15, 16                         |

+------------------+--------------------------------------+

 

mysql-> CREATE TABLE employees (

     ->     id INT NOT NULL,

     ->     fname VARCHAR(30),

     ->     lname VARCHAR(30),

     ->     hired DATE NOT NULL DEFAULT '1970-01-01',

     ->     separated DATE NOT NULL DEFAULT '9999-12-31',

     ->     job_code INT NOT NULL,

     ->     store_id INT NOT NULL

     -> ) ENGINE=Myisam DEFAULT CHARSET=utf8

     -> PARTITION BY LIST (store_id) (

     ->     PARTITION pNorth   VALUES IN (3, 5, 6, 9, 17),

     ->     PARTITION pEast    VALUES IN (1, 2, 10, 11, 19, 20),

     ->     PARTITION pWest    VALUES IN (4, 12, 13, 14, 18),

     ->     PARTITION pCentral VALUES IN (7, 8, 15, 16)

     -> );


当你创建完之后, 你可以进入 Mysql 数据储存文件, 该文件夹位置定义在 Mysql 配置文件中


shawn@Shawn:~$ sudo vi /etc/mysql/my.cnf;

 

[mysqld]

datadir         = /var/lib/mysql

 

shawn@Shawn:~$ cd /var/lib/mysql/dbName

shawn@Shawn:/var/lib/mysql/dbName$ ll 

 

显示如下:

8768 Jun  7 22:01 employees.frm

  48 Jun  7 22:01 employees.par

   0 Jun  7 22:01 employees#P#pCentral.MYD

1024 Jun  7 22:01 employees#P#pCentral.MYI

   0 Jun  7 22:01 employees#P#pEast.MYD

1024 Jun  7 22:01 employees#P#pEast.MYI

   0 Jun  7 22:01 employees#P#pNorth.MYD

1024 Jun  7 22:01 employees#P#pNorth.MYI

   0 Jun  7 22:01 employees#P#pWest.MYD

1024 Jun  7 22:01 employees#P#pWest.MYI

从这里可以看出, 它是把存储文件根据我们的定义进行了拆分

employees.frm = 表结构

employees.par = partition, 申明是一个分区表

.MYD = 数据文件

.MYI = 索引文件

 

HASH 分区
 
HASH 分区主要用来确保数据在预先确定数目的分区中平均分布
如果你想把不同时期加入的员工进行分别存储, 那么你可以将日期字段 hired 作为一个 key

mysql-> CREATE TABLE employees (

     ->     id INT NOT NULL,

     ->     fname VARCHAR(30),

     ->     lname VARCHAR(30),

     ->     hired DATE NOT NULL DEFAULT '1970-01-01',

     ->     separated DATE NOT NULL DEFAULT '9999-12-31',

     ->     job_code INT NOT NULL,

     ->     store_id INT NOT NULL

     -> ) ENGINE=Myisam DEFAULT CHARSET=utf8

     -> PARTITION BY HASH (YEAR(hired)) (

     ->     PARTITIONS 4

     -> );

      

#这里注意的是 PARTITIONS, 多了一个 s

这里要提一下的就是, 如上的例子都是使用的是 Myisam 存储引擎,它默认使用独立表空间, 所以你可以在上面的磁盘空间里看到不同的分区
而 InnoDB 引擎则默认使用共享表空间, 此时就算你对 InnoDB 表进行分区, 你查看下会发现, 它并没有像 Myisam 那么样进行物理上的分区, 所以你需要修改下 Mysql 配置文件:

shawn@Shawn:~$ sudo vi /etc/mysql/my.cnf;

 

#添加: 

innodb_file_per_table=1

 

#重启 mysql

shawn@Shawn:~$ sudo /etc/init.d/mysql restart

此时你再对 InooDB 进行分区, 则会有如下效果:

8768 Jun  7 22:54 employees.frm

   48 Jun  7 22:54 employees.par

98304 Jun  7 22:54 employees#P#pCentral.ibd

98304 Jun  7 22:54 employees#P#pEast.ibd

98304 Jun  7 22:54 employees#P#pNorth.ibd

98304 Jun  7 22:54 employees#P#pWest.ibd

分区管理
 
删除分区

mysql> alter table employees drop partition pWest;  

新增分区

#range添加新分区  

mysql> alter table employees add partition ( partition p4 values less than (26) );  

   

#list添加新分区  

mysql> alter table employees add partition( partition pSouth values in (21, 22, 23) );  

   

#hash重新分区  

mysql> alter table employees add partition partitions 5;  

 类似资料:
  • 本文向大家介绍mysql分表和分区的区别浅析,包括了mysql分表和分区的区别浅析的使用技巧和注意事项,需要的朋友参考一下 数据库的数据量达到一定程度之后,为避免带来系统性能上的瓶颈。需要进行数据的处理,采用的手段是分区、分片、分库、分表。 一、什么是mysql分表和分区 什么是分表,从表面意思上看呢,就是把一张表分成N多个小表 什么是分区,分区呢就是把一张表的数据分成N多个区块,这些区块可以在同

  • 主要内容:分区的优势,分区常用方法,分区技术的不足,分区技术问题解决Redis 分区技术(又称 Redis Partition)指的是将 Redis 中的数据进行拆分,然后把拆分后的数据分散到多个不同的 Redis 实例(即服务器)中,每个实例仅存储数据集的某一部分(一个子集),我们把这个过程称之为 Redis 分区操作。 Redis 实例指的是一台安装了 Redis 服务器的计算机。 分区(Partition)不仅是 Redis 中的概念,几乎所有数据库管理系统

  • 本文向大家介绍mysql的分区技术详细介绍,包括了mysql的分区技术详细介绍的使用技巧和注意事项,需要的朋友参考一下 一、概述 当 MySQL的总记录数超过了100万后,会出现性能的大幅度下降吗?答案是肯定的,但是,性能下降>的比率不一而同,要看系统的架构、应用程序、还有>包括索引、服务器硬件等多种因素而定。当有网友问我这个问题的时候,我最常见的回答>就是:分表,可以根据id区间或者时间先后顺序

  • 本文向大家介绍hive partition分区相关面试题,主要包含被问及hive partition分区时的应答技巧和注意事项,需要的朋友参考一下 解答: 分区表,动态分区

  • 等效分区是一种软件测试技术,其中输入数据被划分为有效值和无效值的分区,并且所有分区必须表现出相同的行为。如果一个分区的条件为真,则另一个等效分区的条件也必须为真,如果一个分区的条件为假,则另一个等效分区的条件也必须为假。等价划分的原则是,测试用例应设计为至少覆盖每个分区一次。每个等效分区的每个值必须表现出与其他分区相同的行为。 等效分区源自软件的要求和规范。这种方法的优点是,它有助于减少测试时间,

  • 本文向大家介绍浅谈PHP的数据库接口和技术,包括了浅谈PHP的数据库接口和技术的使用技巧和注意事项,需要的朋友参考一下 1、php支持哪些数据库(拥有哪些数据库接口) Adabas D ,InterBase ,PostgreSQL ,dBase ,FrontBase ,SQLite ,Empress ,mSQL ,Solid ,FilePro(只读),Direct MS-SQL ,Sybase ,