MYSQL数据库迁移到POSTGRESQL数据库（人工迁移）

时间：2015-08-19 20:53:01 阅读：167 评论：0 收藏：0 [点我收藏+]

产品即将上线，可项目经理说要换数据库，要把mysql数据库的内容全部搬到Postgresql中去。

有一个python的工具可以实现迁移（但是存储过程无法迁移、数据类型也无法灵活对应，还要改程序），为了节约时间采用人工迁移的方式，闲话少说，以下是迁移过程，没图，对不起。

利用Navicat for Mysql工具（其它工具也可以，比如mysqldump)将数据库模式导出（只导表结构不含数据）方法略，生成的文件名为mysql.sql
利用linux sed工具把导出的脚本中的所有COMMENT及mysql的独有原素替换掉，并生成新文件table_new.sql，见以下脚本
cat mytab.sql | sed ‘s/^.*ENGINE=.*$/);/g‘ | sed ‘s/COMMENT.*$/,/g‘ | sed ‘s/`//g‘ > table_new.sql
将所有的INDEX语句单独生成一个文件（此步也可以省略，后面有其它方法）
cat table_new.sql | egrep ‘\-|^\s*KEY|^\s*UNIQUE‘ > key.sql
将所有的外键语句单独生成一个文件（此步可以省略，后面有其它方法）
cat table_new.sql | egrep ‘\-|^\s*CONSTRAINT‘ > constraint.sql
去掉KEY和CONSTRAINT的语句，并生成新文件 table_last.sql
cat table_new.sql | sed ‘s/^\s*KEY.*$//‘ | sed ‘s/^\s*CONSTRAINT.*$//‘ | sed ‘s/^\s*UNIQUE.*$//‘ | sed ‘/^$/d‘> table_last.sql
转换换行符
unix2dos table_last.sql
把文件COPY到WINDOWS中，用记事本工具（或其它工具）对一些特殊值进行查找、替换操作（此步的意思就是把mysql中的类型对应到postgresql中的类型），比如：
查找 ID int(12) NOT NULL AUTO_INCREMENT 替换 ID bigserial NOT NULL （自增长类型字段）
查找 datetime 替换 timestamp
……
重新整理一些特殊表，因为第5步中去掉了所有KEY和CONSTRAINT的语句，所以如果表字段中包括KEY开头或是CONSTRAINT开头的字段时（比如字段 KEYCD，KEYTTL等）要把这些特殊的表的建表语句手工制作一变，并在table_last.sql中替换掉原来的语句。
在Postgresql中执行table_last.sql语句（方法略），如果有错误进行微调，直到所有表建立成功。
导入数据（先在mysql中导出，导出后的文件要替换换行符不然报错，然后再导入到postgresql)
1. 导出语句（在MYSQL中执行以下语句，并复制结果后再次执行，便会在服务器的目录下生成以每个表为单位的数据文件,我用的工具是Navicat for Mysql。注意替换table_schema，这里生成数据文件的目录为：/usr/local/mysql/outfile/，也可换成其它目录）
2. ```
SELECT CONCAT(‘select * from ‘,
table_name,
" into outfile ‘/usr/local/mysql/outfile/",
table_name ,
‘.dat‘ ,"‘"
" fields terminated by ‘|‘ ;")
FROM information_schema.tables
WHERE table_schema=‘DEVELOP‘;
```
3. 替换换行符后将生成的文件COPY到postgresql服务器的目录下
  sed -i ‘s/\r//g‘ outfile/*
4. 导入语句（在postgresql中执行，得到查询结果后复制查询结果，并再次执行,注意一定要用有superuser权限的用户执行，这里用的是pgadmin工具，目录是/tmp/data,注意替换table_catalog中的值，我的数据名为DEVELOP）
5. ```
select ‘copy necsl.‘||table_name|| ‘ from ‘ || chr(39)||‘/tmp/data/‘
||upper(table_name)||
‘.dat‘ || chr(39) ||
‘ with DELIMITER ‘ || chr(39) || ‘|‘ || chr(39) ||‘;‘ 
from information_schema.tables
where table_schema=‘necsl‘ and
table_catalog=‘DEVELOP‘ ;
```
数据导入后可以用以下方法验证是否导入正确

--在mysql及PG中分别建立下表
create table table_count(tblname varchar(100) primary key not null,tblrecorder integer);

/*在mysql中执行以下语句，并将结果复制后再次执行，将会生成在表table_count中生成每张表有多少记录*/
SELECT CONCAT(‘insert into table_count select ‘ ,"‘",table_name,"‘",‘ ,count(*) from ‘,
table_name ,";")
FROM information_schema.tables
WHERE table_schema=‘DEVELOP‘;


--在postgresql中执行以下语句，并将结果复制后再次执行，将会生成在表table_count中生成每张表有多少记录,然后与mysql中table_count的表比较即可
select ‘insert into necsl.table_count select ‘|| quote_literal(table_name) ||‘,count(*) from   necsl.‘||table_name|| ‘;‘  
from information_schema.tables
where table_schema=‘necsl‘ and
table_catalog=‘DEVELOP‘ ;

--如果导入有问题，可以在PG中执行以下句语生成清空所有表的语句，将执行结果复制再执行即可清空所有表
PG truncate
select ‘truncate table  necsl.‘||table_name|| ‘;‘  
from information_schema.tables
where table_schema=‘necsl‘ and
table_catalog=‘DEVELOP‘ ;

/*生成索引信息及外键，在mysql中分别执行以下语句，并将结果复制到POSTGRESQL中执行*/
/*生成唯一索引*/
select 
   CONCAT (
     ‘CREATE UNIQUE INDEX ‘ ,          
      table_name,‘_IDX_‘,index_name,
     ‘ ON ‘,
      table_name,
     ‘(‘,
      GROUP_CONCAT(column_name order by seq_in_index),
      ‘);‘
)
from statistics
where table_schema=‘DEVELOP‘
AND INDEX_NAME <>‘PRIMARY‘
AND INDEX_SCHEMA=‘DEVELOP‘
AND NON_UNIQUE=0
GROUP BY index_name,table_name
ORDER BY TABLE_NAME,INDEX_NAME,seq_in_index asc


/*生成btree索引*/
select 
   CONCAT (
     ‘CREATE INDEX ‘ ,          
      table_name,‘_IDX_‘,index_name,
     ‘ ON ‘,
      table_name,
     ‘(‘,
      GROUP_CONCAT(column_name order by seq_in_index),
      ‘);‘
)
from statistics
where table_schema=‘DEVELOP‘
AND INDEX_NAME <>‘PRIMARY‘
AND INDEX_SCHEMA=‘DEVELOP‘
AND NON_UNIQUE=1
GROUP BY index_name,table_name
ORDER BY TABLE_NAME,INDEX_NAME,seq_in_index asc

/*生成外键 */
select
concat(‘alter table ‘,
c.TABLE_NAME,
‘ add constraint ‘,
c.CONSTRAINT_NAME,
‘ foreign key(‘,
c.COLUMN_NAME,
‘) references ‘,
c.REFERENCED_TABLE_NAME,
‘( ‘,
c.REFERENCED_COLUMN_NAME,
‘);‘)
from TABLE_CONSTRAINTS t,KEY_COLUMN_USAGE c
where t.CONSTRAINT_SCHEMA=‘DEVELOP‘
AND t.CONSTRAINT_TYPE=‘FOREIGN KEY‘
AND t.TABLE_SCHEMA=‘DEVELOP‘
AND c.REFERENCED_TABLE_SCHEMA=‘DEVELOP‘
AND t.CONSTRAINT_NAME =c.CONSTRAINT_NAME
and t.table_name=c.table_name;

17.生成以上信息后，在PG中建立以下函数，用于重置所有的sequence（如果没有自增长类型可忽略此步），建立放在public模式下

CREATE OR REPLACE FUNCTION pro_resetallseq()
  RETURNS void AS
$BODY$
 DECLARE
           tmp VARCHAR(512);
           maxval bigint;
           stmt  record;
 BEGIN
       FOR stmt IN   select sequence_name,REPLACE(sequence_name,‘_id_seq‘,‘‘) as tnm from information_schema.sequences where 

sequence_catalog=‘DEVELOP‘ and sequence_schema=‘necsl‘  LOOP
                  
		  tmp := ‘SELECT MAX(ID) FROM ‘|| quote_ident(stmt.tnm) || ‘;‘;
		  EXECUTE tmp into maxval;
                  if not (maxval  is NULL or maxval = 0) then                    
                     EXECUTE ‘SELECT SETVAL(‘|| quote_literal(stmt.sequence_name) || ‘,‘ || maxval || ‘);‘;
                  end if;                  
                  
       END LOOP;
       RAISE NOTICE ‘finished .....‘;
       END;
$BODY$
  LANGUAGE plpgsql

18.建立成功后可以用以下语句重置所有的sequence

select pro_resetallseq();

19.关于mysql中的函数（存储过程）因为语法差别较大，只能在PG中重写。我没有找到太好的方法。

因为时间紧，所以没有写工具，过程也比较粗糙，仅供参考，如果有好的建议欢迎留言，谢谢阅读。

本文出自 “镜子” 博客，请务必保留此出处http://383133430.blog.51cto.com/454215/1686169

MYSQL数据库迁移到POSTGRESQL数据库（人工迁移）

标签：数据库 mysql 迁移数据 postgresql

原文地址：http://383133430.blog.51cto.com/454215/1686169

踩

(0)

评论一句话评论（0）

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)

周排行