逆向知识第七讲,三目运算符在汇编中的表现形式,以及编译器优化方式

2018-01-08 14:29:37 浏览数 (1)

                  逆向知识第七讲,三目运算符在汇编中的表现形式

一丶编译器优化方式

首先说一下编译器优化方式.

1.常量折叠

2.常量传播

3.复写传播

4.公共表达式

5.去掉不可达到分支

6.顺序代替分支

7.数学变化

8.代码外提

9.减少变量.

10 强度削弱.

优化方式解析

1.常量折叠

  常量折叠已经讲过, 就是两个常量相加  8 8 ,那么在编译前期就能计算出来.

2.常量传播

  当一个变量,没有对齐进行写入或者更改的时候,这个时候可以当做常量.(优化为常量)

3.复写传播

  这个需要好好说说了,我们都知道,C语言中,C调用约定都需要平栈.比如你调用完毕一个printf,那么就需要平栈.

     而优化的时候,直接一起平栈了.

就比如:

  int i = (a * a b);

  int j = i * 5;

那么此时可以变成  int j = (a * a b) * 5 ;这样就会省掉一个变量(当然和去除变量不一样)

call addr

add esp,8

call  addr

add esp,8

此时汇编代码可以变成

call addr 

call addr

add esp,16   这样就省掉了一个add 指令了.

4.公共表达式

公共表达式和复写传播有点不一样.(看着是相反的.但是不能说是相反的.)

比如 int i = (a *a * b) * 7;

  int j = (a * a * b) * 7 * 3

优化之后变成.

int j = i * 3;

什么是公共表达式,就是说,表达式用的都是一样的.重复使用,这样的时候,可以使用变量来存着了.或者中专一个寄存器保存其结果.

这样效率会很快,不用重新计算了.

5.去掉不可达到分支

这个应该很好理解.

代码语言:javascript复制
if(1)
{
    ......
}
else
{
    .....  
}

此时if语句会成立,而else永远不会成立,那么编译器优化的时候就可以去掉else语句了.

6.顺序代替分支

这个下方讲解三木运算符的时候可以明白.

7.数学变化

这也很好理解.

3a 5a

那么此时可以变为一条表达式计算直接变成8a

8.代码外提

也很好理解.

代码语言:javascript复制
for (int i = 0; i < (argc / 3);i  )
{
            
    ..............
    //中间没有使用argc变量  
}

中间没有使用argc变量.

那么此时优化的时候,可能会用寄存器,也或者会用一个局部变量保存  (argc / 3)

int j = (argc / 3);

那么此时for循环的条件变成了  i < j即可.

这样就不用每次循环一遍就计算一遍(argc / 3)了.

9.减少变量.

定义的变量没有使用,优化的时候自然就会消失了.(减少空间)

10 强度削弱.

很好理解.我们都知道除法的指令周期很长.所以前边讲解除法的时候各种套路,各种数学定理各种公式.

目的是什么,目的就是为了让指令周期缩短一点.

强度削弱指的就是,当时用高指令周期的指令的时候,可不可以使用低指令周期完成高指令周期做的事情.

比如说:

  一个DIV指令是100指令周期(当然你可以想象成100秒)

那么一个移位是10个指令周期

此时我计算  一个公式  n  / 4;

那么可以变成

mov eax,[ebp - xxx]

sar  eax,2

也完成了DIV的作用.  如果看做是100秒时间,那么我们只用了10^n秒(n的取值看上面的指令,比如mov,占4个指令周期,举个例子,那么合起来才14个指令周期)

二丶三木运算符在汇编中的表现形式

高级代码:

代码语言:javascript复制
#include "stdafx.h"
#include "MyClass.h"

int main(int argc, char* argv[])
{
    unsigned int nVar_4 = 5;
    scanf("%d", &nVar_4);
    printf("%drn", argc == 0 ? 0 : -1);              第一种表达方式,判读为零还是为1的情况
    
    printf("%drn", argc > 9 ? argc*nVar_4 : nVar_4/argc);   第二种表达方式,无法优化的表达方式.
    
    printf("%drn", argc == 9 ? 35 : 98);             第三种表达方式,利用0和-1来运算
    printf("%drn", argc >= 9 ? 35 : 98);             第四种表达方式,指令支持
}

1.三木运算符第一种表达形式.

有用的汇编代码就4行.

1.变量给寄存器保存.

2.寄存器内容求补码

3.带进位的减法.

首先说下什么意思.

这里是无分支三木运算

neg的意思就是求补, 但是运算的时候是 ecx = 0 - ecx值.

neg只有 0 - 0的时候才不会借位. 

还原代码要从三方面考虑

为零的情况下

为零的时候,neg 一下,那么其结果还是 0,CF位没有借位.

还原代码为:

代码语言:javascript复制
if(argc == 0)
{
     ecx  = 0;  
}

为负数的时候:

如果为负数的时候,那么

neg一下,其结果是 0 - 负数 (CF借位,则置位1)

sbb  负数- 负数 -  CF   结果是-1

还原代码为:

代码语言:javascript复制
if(argc < 0)
{
    ecx = -1;
  
}

为正数的情况下

如果是正数

neg一下  0 - 正数 = 负数, 那么CF借位了,其结果是1

sbb一下.  负数- 负数 - CF   其结果是 -1  (负数- 负数= 0,0 - CF(1) = -1)

还原代码:

代码语言:javascript复制
if(argc > 0)
{
   ecx == -1;  
}

总结上面方面情况还原得出其还原代码为.

代码语言:javascript复制
if(argc < 0) ecx = -1;
if(argc ==0) ecx = 0;
if(argc > 0) ecx = -1;

如果转化为三木运算符,这个就看自己爱怎么转化了

比如:

  argc ==0 ? 0 : -1

a ?  b :c 以后分为a b c讲解,a代表表达式和条件 ,b和C代表其结果.

其中,这种优化方式,则是顺序优化.也就是上面没说的.结果之后有一方成立

2.三木运算符的第二种表达方式

 高级代码:

printf("%drn", argc > 9 ? argc*nVar_4 : nVar_4/argc);

这个代码,无法优化,因为不知道变量是多少.看下汇编代码把.

这个很简单了.

1.局部变量给寄存器保存.

2.和9比较

3.小于怎么怎么做

4.大于怎么怎么做.

3.三木运算符的高级汇编表示,利用0和-1

高级代码:

printf("%drn", argc == 9 ? 35 : 98);

对应汇编代码:

这个汇编代码要分为两部分看,三部分代入.

1.相等的情况下怎么走

2.大于的时候怎么走

3.小于的时候怎么走.

1.相等的时候怎么走(属于代入)

看第一部分代码:

看上面汇编代码解析

这里的esi是argc变量,因为上下文关系,所以变量的值已经在esi保存了。

现在我们带入走汇编指令

当esi == 9的时候

第二句   sub edx,9  (结果为0)

第三句   neg edx    (0 - 0 还是0)

第四句   sbb edx,edx (0 - 0 - CF, 此时因为neg所以CF = 0 所以就是 0 - 0 - 0 还是0

接着看下方第二部分代码

为零的时候,edx 走到and之后,还是0

然后接着add 那么其结果是23h

由此还原汇编代码:

if(argc == 9) edx = 23h

2.大于的时候怎么走

还是同上

1.如果> 9,那么 sub后结果是正数

2.neg之后. 0 - 正数= 负数  (0 - 正数的时候,借位了,所以CF位是1)

3.sbb 之后 负数- 负数 = 0, 然后- CF位 = -1;

4.如果是-1,那么and之后其结果是3FH

5.接着add之后其结果是 (3fh 23h)

还原代码:

if (argc > 9) edx = (3fh 23h)

3.小于的时候怎么走

1.sub之后, 结果为负数

2.neg之后( 0 - 负数 = 取负数的绝对值(负负得正),有借位,所以CF = 1)

3.sbb 之后, 正数- 正数 - CF = 正数- 正数 - 1 = -1;

4.结果为-1,那么and起作用

5,执行add,加23h

还原代码:

代码语言:javascript复制
if (argc < 9) edx = (0c1h   23h)

综上条件,换成三目运算其结果是:

代码语言:javascript复制
if(argc < 9) edx = 3fh   23h
if(argc ==9)edx = 23h
if(argc > 9) edx = (3fh   23h)

那么可以还原成:

  argc == 9 ? 23h : 62h

注意这里的3Fh,这里的3Fh,是 c - b (如果条件取反,那么则是b-c)的结果.

四丶指令支持版本

高级代码:

printf("%drn", argc >= 9 ? 35 : 98);

汇编代码: 

image.pngimage.png

注意,

esi还是 argc的值

这里出现了新的指令 setl指令,这属于set系列

和条件跳转指令一样

比如 jns jle(小于等于) jge(大于等于) ....

这里setl l代表小的意思也就是小于

那么就很简单了.

1.局部变量和9比较

2.如果小于9,则al设置为1

3.dec相减,结果为0

4.根据0和非0的值去and,如果为零,则 and al 0c1h则没用

5.最后add即可.

也是三部分代入,这里和上面类似.我直接代入还原代码.

但是需要注意,这里是如果小于则会设置al,那么就是小于的时候会走一个,而大于或者等于,其结果有不一样.

小于的情况下:

  1.和9比较

  2.小于9,al设置为1

  3.dec eax, 1 - 1 = 0;结果为零.

  4.为零,那么and执行之后还是0

  5.执行add

还原代码:

  根据上面得知,小于9 会执行 add

if(argc < 9) reg32 = 62h

大于或者等于的情况下.

1.和9比较,大于9

2.大于9,则al不设置,结果为0

3.dec eax, 0 - 1 = -1,其结果变成-1,也就是FFFFFFFF

4.结果为-1,则and成立,其结果变为0C1H

5.add eax,62 紧接着加上其结果

还原代码

if(argc >=9) reg32 = (c1 62h)注意这里会进位的.

综上所述,可以得出:

if(argc < 9) reg32 = 62h if(argc >= 9)reg32 = (0c1h 62h);

(0c1h 62)然后看结果,后八位(因为我们是32位系统)其结果是35

还原三目运算符为:

argc >= 9 ? 35:98

0 人点赞