概述
异构数据库的迁移(譬如从Oracle迁移到PostgreSQL)工作主要包括三个方面,
- 数据库对象的迁移,包括库、模式、表、索引、视图、触发器、存储过程等等;
- 数据内容的迁移,主要指的是数据表中的数据;
- 数据应用的迁移,主要指的是应用中SQL语句的迁移。
目前对于数据库对象以及数据内容的迁移有很多成熟的工具,而对于应用迁移的工具却很少能够见到。原因是因为DML语句比DDL复杂的多,不同的数据库语法差异也比较大。目前市场上的迁移工具大多使用正则表达式来解析SQL语句,而DML语句的复杂性导致此类工具的解析成功率较低,难以作为一个成熟地商业产品进行推广。
PawSQL团队开发的DML语法转换工具Ora2pg,通过PawSQL强大的SQLParser,能够解析几乎所有的Oracle语法,并将其转换为对应的PostgreSQL语法,支持数据库应用的平滑迁移。
本手册介绍了Oracle和PostgreSQL的语法区别,以及转换映射关系,可以作为迁移人员的SQL迁移参考手册。 本手册描述了PawSQL Ora2pg内部的实现逻辑,PawSQL Ora2pg能够帮助SQL迁移人员自动识别不兼容的语法,并完成语法转换。
虚拟表(dual)
虚拟表dual
Oracle获取一个常量需要通过一个dual,PostgreSQL不需要
编号 | Oracle | PostgreSQL |
---|---|---|
1 | select 2 from dual | select 2 |
虚拟列
虚拟列rownum
对于查询返回的每行数据,rownum虚拟列会返回一个数字,第一行的ROWNUM为1,第二行为2,以此类推。
- rownum在select列表中时重写为row_number() over ()
- rownum在where子句中时重写为limit... offset...
编号 | Oracle | PostgreSQL |
---|---|---|
1 | select rownum from customer; | select row_number() over () as rownum from customer |
2 | select tableoid from customer where rownum < 10 and rownum >= 2; | select tableoid from customer limit 9 OFFSET 2 |
3 | select c_name from customer where rownum < 10 and c_phone = '111'; | select customer.c_name from customer where customer.c_phone = '111' limit 9 |
4 | select * from customer where rownum between 1 and 10; | select tableoid from customer limit 10 OFFSET 0 |
虚拟列rowid
Oracle中的rowid虚拟列返回特定行的具体地址,在PostgreSQL中重写为tableoid || '#' || ctid
编号 | Oracle | PostgreSQL |
---|---|---|
1 | select rowid, c.* from customer c; | select tableoid || '#' || ctid, c.* from customer as c |
字符串函数
nvl(col, value)
Oracle中的nvl(col, value)用来设置默认值,col为空就设置为value;
在PostgreSQL中重写为coalesce
编号 | Oracle | PostgreSQL |
---|---|---|
1 | select nvl(c_phone, 1) from customer; | select coalesce(customer.c_phone, '1') from customer |
nvl2(col, v1, v2)
nvl2对col的null值进行处理,如果col为null,则返回v1, 否则返回v2;
postgre中没有类似的函数,可以重写为case... when...
编号 | Oracle | PostgreSQL |
---|---|---|
1 | select nvl2(c_phone, 1, 2) from customer; | select case when c_phone is null then 1 else 2 end from customer |
decode(arg1, arg2, arg3, arg4)
Oracle中的decode(arg1, arg2, arg3, arg4)函数, 表示当 arg1 等于 arg2 时,取 arg3,否则取 arg4。
postgre中没有类似的函数,可以重写为case... when...
编号 | Oracle | PostgreSQL |
---|---|---|
1 | select decode(c_phone,'110', 1 , 2) from customer; | select case when c_phone = '110' then 1 else 2 end from customer |
2 | select decode(c_phone,null, 1 , 2) from customer; | select case when c_phone is null then 1 else 2 end from customer |
substr(str, int, int)
Oracle中的substr用来取一个字符串的子串,PostgreSQL有同名的函数实现类似功能。不同的是Oracle中,第二、第三个参数可以为负数,代表从后面进行计数,PostgreSQL不允许其为负数,需对其进行转换。Oracle中是以0开始计数,PostgreSQL以1开始计数(需确认)。
编号 | Oracle | PostgreSQL |
---|---|---|
1 | select substr(c_phone, 1 , -2 ) from customer; | select substr(c_phone, 1, length(c_phone) - 2) from customer |
2 | select substr(c_phone, -3 , 1 ) from customer; | select substr(c_phone, length(c_phone) - 3, 1) from customer |
instr(str1, str2)
Oracle中的instr用来取一个字符串的子串位置,当其只有两个参数时,表示子串的第一次出现的位置,和PostgreSQL中对应的函数为strpos。当其有多个参数时,无对应函数。
编号 | Oracle | PostgreSQL |
---|---|---|
1 | select instr('123', '23') | select strpos('123', '23') |
replace(srcstr, oldsub[, newsub ])
在Oracle中,replace()函数用于替换字符串, replace(srcstr, oldsub[, newsub ] ),和PostgreSQL中的replace函数用法基本一致。只是需要注意在Oracle中无第三个参数时,代表删除此字符,在PostgreSQL可将第三个参数设置为''。
编号 | Oracle | PostgreSQL |
---|---|---|
1 | select replace('123','1'); | select replace('123','1',''); |
stragg(str,[str])
Oracle里的stragg函数实现在分组内对列值的拼接,它和listagg类似,但是不可以指定拼接的顺序。在PostgreSQL中,可以使用string_agg函数来替换。其第二个参数可选,默认值为'',在PostgreSQL需补充第二个参数。
编号 | Oracle | PostgreSQL |
---|---|---|
1 | select listagg(c_name,',') as name from customer group by c_phone | select string_agg(c_name,',') as name from customer group by c_phone |
2 | select listagg(c_name) as name from customer group by c_phone | select listagg(c_name,'') as name from customer group by c_phone |
listagg(str, [str])
Oracle里的listagg函数实现对列值的拼接,它可以在分组内以指定顺序对非分组列进行拼接。在PostgreSQL中,可以使用string_agg函数来实现,需注意语法方面也有区别. 另外,其第二个参数可选,默认值为'',在PostgreSQL需补充第二个参数。
- 当没有group by子句时,可以使用over(partiton by... order by...)进行替换
- 当指定group by子句时,它的重写算法比较复杂
- 如果需要保持拼接的顺序,需要通过子查询来实现(见编号2)
- 如果不需要保持拼接顺序,可以把它转化为简单的聚集函数(编号3)
编号 | Oracle | PostgreSQL |
---|---|---|
1 | select listagg(c_name,',') within group(order by c_name) over (partition by c_phone) as name from customer; | sselect string_agg(customer.c_name, ',') over (partition by customer.c_phone order by c_custkey) as name from customer |
2 | select listagg(c_name,',') within group(order by c_name) as name from customer group by c_phone; | select max(paw_dt.name) as name from (select string_agg(customer.c_name, ',') over (partition by customer.c_phone order by c_name) as name, customer.c_phone from customer) as paw_dt group by c_phone |
3 | select listagg(c_name,',') within group(order by c_name) as name from customer group by c_phone | select string_agg(c_name,',') as name from customer group by c_phone |
日期函数
sysdate/systimestamp
Oracle中的sysdate()/sysdate返回系统当前时间(日期 时分秒),在PostgreSQL中对应now()或是current_timestamp(日期 时分秒 毫秒)。
Oracle中的systimestamp返回系统当前时间戳(日期 时分秒 毫秒),在PostgreSQL中对应now()或是current_timestamp。
编号 | Oracle | PostgreSQL |
---|---|---|
1 | select sysdate | select current_timestamp |
2 | select sysdate() | select now() |
3 | select systimestamp | select current_timestamp |
to_date(str, fmt)
Oracle中的to_date返回的是时间类型,而在PostgreSQL中to_date是日期类型,所以Oracle中的to_date在PostgreSQL中应该对应to_timestamp
编号 | Oracle | PostgreSQL |
---|---|---|
1 | select to_date( endTime ,'yyyy-mm-dd hh24:mi:ss') from t | select to_timestamp( endTime ,'yyyy-mm-dd hh24:mi:ss') from t |
trunc(arg1, [arg2])
在Oracle中trunc函数有两种用法
- 第一种是对数字进行截取, trunc(num,[int]); 是去掉数字num小数位以后的部分,并且不进行四舍五入。这种用法和在PostgreSQL的trunc用法一致,不需要转换
- trunc函数的第二种用法是对日期进行提取,trunc(date,[fmt])。这种用法在PostgreSQL对应的函数是date_trunc(fmt, date),需注意在PostgreSQL中fmt是第一个参数,且不可省略。
编号 | Oracle | PostgreSQL |
---|---|---|
1 | select trunc( 111.23,2) | select trunc( 111.23,2) |
2 | select trunc(sysdate,'year') | select date_trunc('year', current_timestamp) |
3 | select trunc(sysdate) | select date_trunc('dd', current_timestamp) |
add_months(date, int)
Oracle中的add_months 函数主要是对日期函数进行操作,对日期按月增加。在PostgreSQL没有对应的函数,需将其转化为基于日期和interval的运算。
编号 | Oracle | PostgreSQL |
---|---|---|
1 | select add_months(sysdate, 2) | select current_timestamp 2 * interval '1 month' |
last_day(date)
Oracle中的last_day返回指定日期所在月份的最后一天; 在PostgreSQL没有对应的函数,需将其转化为基于日期和interval的运算。
编号 | Oracle | PostgreSQL |
---|---|---|
1 | select add_months(sysdate, 2) | select cast(date_trunc('MONTH', current_timestamp) interval '1 MONTH - 1 DAY' as date) |
SQL语句
HAVING子句顺序
Oracle允许HAVING在GROUP BY子句之前或之后。在PostgreSQL中,HAVING子句必须出现在GROUP BY子句后面。
编号 | Oracle | PostgreSQL |
---|---|---|
1 | select c_name from customer having count(*) > 2 group by c_name | select c_name from customer group by c_name having count(*) > 2 |
括号中的表名
Oracle中单表引用允许使用括号括起来,PostgreSQL不允许。
编号 | Oracle | PostgreSQL |
---|---|---|
1 | SELECT * FROM (CUSTOMER); | SELECT * FROM CUSTOMER; |
UNIQUE关键字
Oracle中允许使用UNIQUE进行去重,在PostgreSQL中迁移为DISTINCT关键字
编号 | Oracle | PostgreSQL |
---|---|---|
1 | select unique c_phone from customer | select distinct customer.c_phone from customer |
MINUS关键字
Oracle中可以使用minus关键字来取两个结果集的差,在PostgreSQL中需迁移为except.
编号 | Oracle | PostgreSQL |
---|---|---|
1 | select c_custkey from customer minus select o_custkey from orders | select c_custkey from customer except select o_custkey from orders |
FROM关键字
Oracle的delete语句的FROM关键字可以省略,迁移至PostgreSQL需补充上。
编号 | Oracle | PostgreSQL |
---|---|---|
1 | delete customer where 1=0; | delete from customer where 1 = 0 |
NOLOGGING关键字
Oracle在执行INSERT语句时,可以通过指定NOLOGGING关键字来减少日志记录,提升操作性能。PostgreSQL不支持此关键字。
编号 | Oracle | PostgreSQL |
---|---|---|
1 | insert into customer nologging select * from customer_bk; | insert into customer select * from customer_bk; |
AS关键字
INSERT INTO 后面不需要添加as关键字,insert into ... as select...
修改为insert into... select...
编号 | Oracle | PostgreSQL |
---|---|---|
1 | insert into t as select c1 from t1 | insert into t select c1 from t1 |
FROM子查询的别名
Oracle中在不引起歧义的情况下子查询可以不带别名,而在PostgreSQL中,所有的FROM子查询都必须带有别名
编号 | Oracle | PostgreSQL |
---|---|---|
1 | select * from (select * from CUSTOMER) | select * from (select * from CUSTOMER) as foo |
UPDATE语句里的字段名
在PostgreSQL中,Update的时候,更新列不允许添加表名前缀。
编号 | Oracle | PostgreSQL |
---|---|---|
1 | update customer c set c.c_name = 'xxx' where c_custkey = 1; | update customer set c_name = 'xxx' where c_custkey = 1 |
左(右)外连接
在Oracle中,外连接可以通过在条件上添加( )来定义, 连接符( )跟在哪个条件后面就是哪张表被左连。在PostgreSQL中,需将其重写为标准的外连接语法。
编号 | Oracle | PostgreSQL |
---|---|---|
1 | select * from customer, orders where c_custkey = o_custkey( ) | select * from customer left outer join orders on c_custkey = o_custkey |
2 | select * from customer, orders where c_custkey( ) = o_custkey and c_name( ) = o.o_clerk and o_custkey>100 | select * fromcustomer right outer join orders on (c_custkey = o_custkey and c_name = o_clerk) where o_custkey > 100 |
CONNECT BY子句
Oracle中,CONNECT BY 用于存在上下级等层级关系的数据表进行递归查询。语法格式: START WITH condition1 CONNECT BY [ NOCYCLE ] condition2。在PostgreSQL通过Recursive Common Table Expression来实现此功能,主要是把START WITH... CONNECT BY Prior拆成两个部分,查询表一致,但条件不一致,用UNION ALL合并.
编号 | Oracle | PostgreSQL |
---|---|---|
1 | select id from city_branch start with id=1 connect by prior id=parent_id; | with RECURSIVE MIG_CTE as (select id, 1 as level from city_branch where id = 1 union all select id, level 1 from city_branch, MIG_CTE where MIG_CTE.id = parent_id)select * from MIG_CTE |
2 | select t.branch_level, t.id from city_branch c where (c.branch_level = '1' or t.branch_level = '2') and (t.sign = '1' or t.sign = '4' or t.sign = '8') and t.status = '1' start with c.id = 1 connect by c.id = prior c.parent_id order by c.branch_level desc | with RECURSIVE MIG_CTE as (select t.branch_level, t.id, 1 as level from city_branch as cwhere ((((branch_level = '1' or t.branch_level = '2')and ((t.sign = '1' or t.sign = '4') or t.sign = '8')) and t.status = '1') and c.id = 1) union all select t.branch_level, t.id, level 1 from city_branch as c, MIG_CTE where ((((branch_level = '1' or t.branch_level = '2') and ((t.sign = '1' or t.sign = '4') or t.sign = '8')) and t.status = '1') and c.id = MIG_CTE.parent_id))select * from MIG_CTE order by MIG_CTE.branch_level desc |
操作符的强类型限制
Oracle中不同类型进行基于操作符的运算,会自动转化类型,譬如select 1 '1' from dual
。PostgreSQL是强类型,不同类型的运算会提示类型不匹配,执行select 1 '1'
会报错,需要进行显式的类型转换。
涉及的操作符类型包括:
操作符 | 操作符名称 |
---|---|
| 加法 |
- | 减法 |
/ | 除法 |
% | 取余 |
* | 乘法 |
|| | 字符串拼接 |
数值运算( ,-,*,/,%)
编号 | Oracle | PostgreSQL |
---|---|---|
1 | select 1 '1' | select 1 1 |
2 | select 1 charCol from tbl | select 1 cast(charCol as numeric) from tbl |
3 | select '1' - 1 | select 1- 1 |
4 | select 1 * charCol from tbl | select 1 * cast(charCol as numeric) from tbl |
5 | select 1 / charCol from tbl | select 1 /cast(charCol as numeric) from tbl |
6 | select charCol % 2 from tbl | select cast(charCol as numeric) % 2 from tbl |
日期计算( ,-)
编号 | Oracle | PostgreSQL |
---|---|---|
1 | select sysdate - 1 | select current_timestamp - interval '1' DAY |
2 | select 1 sysdate() | select interval '1' DAY now() |
3 | select systimestamp 1 | select current_timestamp interval '1' DAY |
4 | select systimestamp - 1 | select current_timestamp - interval '1' DAY |
字符串拼接(||)
编号 | Oracle | PostgreSQL |
---|---|---|
1 | select 1||1 | select '1'||'1' |
2 | select 1 || c_custkey | select 1 || cast(c_custkey as text) |
函数参数的强类型限制
Oracle中在函数调用时,参数类型进行会自动转化类型,譬如 select substr(123.12,0,2)
是合法的,且返回123
。PostgreSQL是强类型, 执行select substr(123.12,0,2)
会报错,需要进行显式的类型转换。
substr(arg1, arg2, arg3)
编号 | Oracle | PostgreSQL |
---|---|---|
1 | select substr(1234.1, 0, 4) | select substr('1234.1', 1, 4 1) |
2 | select substr('1234.1', 0, '2') | select substr('1234.1', 0, 2) |
sum(arg)
编号 | Oracle | PostgreSQL |
---|---|---|
1 | select sum('2') | select sum(2) |
avg(arg)
编号 | Oracle | PostgreSQL |
---|---|---|
1 | select avg('2') | select avg(2) |
round(arg)
编号 | Oracle | PostgreSQL |
---|---|---|
1 | select round('2') | select round(2) |
条件判断中的强类型限制
Oracle中在进行条件判断时,左右表达式的类型进行会自动转化,譬如 where c_phone = 110
是合法的。PostgreSQL是强类型, 执行where c_phone = 110
会报错,需要进行显式的类型转换。
比较运算(=、>、<、>=、<=、<>)
转换原则,优先转换常量类型;当两个都为数据列时,优先转换左边的。
编号 | Oracle | PostgreSQL |
---|---|---|
1 | select * from customer where c_phone = 110 | select * from customer where c_phone = '110' |
2 | select * from customer where '1' = c_custkey | select * from customer where 1 = c_custkey |
3 | select * from customer where c_phone = c_custkey | select * from customer where cast(c_phone as int) = c_custkey |
BETWEEN
转换原则,转换 var0 between var1 and var2 中的 var1, var2。
编号 | Oracle | PostgreSQL |
---|---|---|
1 | select * from customer where c_custkey between '100' and '200'; | select * from customer where c_custkey between 100 and 200 |
IN LIST
转换原则,转换List中的变量。
编号 | Oracle | PostgreSQL |
---|---|---|
1 | select * from customer where c_phone in (110,120); | select * from customer where c_phone in ('110', '120') |
默认参数
Oracle中有部分函数存在默认参数,而在PostgreSQL其参数是必填项。
to_char(unknown)
编号 | Oracle | PostgreSQL |
---|---|---|
1 | select to_char(c_custkey) from customer | select cast(c_custkey as text) from customer |