标识符和表达式
标识符和表达式是程序设计经常用到的两个基本概念。在用高级语言进行程序设计时,如果程序要对某个变化的量进行处理时,通常都要对该变化量定义一个具有某种数据类型的符号名,用该符号名也就等于使用了该变化量。在汇编语言中,也是如此,所不同的是它们的说明和引用方式不同。
4.1 标识符
在汇编语言中,标号、内存变量名、子程序名和宏名等都是标识符,它一般最多由31个字母、数字及规定的特殊字符(?、@、_、$)等组成,并且不能用数字开头。通常情况下,汇编语言不区分标识符中字母的大小写。
和高级语言的变量名一样,一般要求标识符尽可能取得有点含义,这会大大改善程序的可读性,并有助于对程序的理解。但标识符不能是汇编语言的保留字,汇编语言的保留字主要是指:指令助忆符、伪指令定义符、寄存器名以及一些具有特殊含义的字符串等。
例如:MSG1、ERRMSG2、ASC1、asc2等是合法的标识符,而1a、ah、mov等就不是合法的标识符。
试比较ABCDH和0ABCDH之间的差异。前者是标识符,而后者是十六位进制数值。
4.2 简单内存变量的定义
在编程序时,我们往往要根据程序的需要定义一些内存单元。在高级语言程序中,要给存储单元取一个符号名,然后通过引用该符号名来访问其所对应的存储单元,而在汇编语言程序中要灵活一些,它可以给存储单元取符号名,也可以不取符号名。当给存储单元取符号名时,则可通过该符号名来访问其对应的存储单元;当不给存储单元取符号名时,则可通过存储单元的偏移量(有效地址)来访问它。
汇编语言中,常见的数据类型有字节、字和双字等。下面介绍如何定义各种整型类型的内存变量,有关浮点类型变量的定义方式将在第11章中介绍
4.2.1 内存变量定义的一般形式
定义数据变量语句是在程序中经常使用的伪指令语句,其一般格式如下:
[变量名] 数据定义符 表达式1[, 表达式2, …, 表达式n] ;注释
该定义格式的主要解释如下:
1、变量名必须是一个合法的标识符,它可以写,也可以不写; 2、 数据定义符用于确定内存单元的数据类型,常用的定义符有:DB、DW和DD等; 3、 表达式是定义内存单元时的初值表达式,一个定义语句可以有多个初值表达式,各表达式之间必须用逗号‘,’分开;如果某个存储单元没有初值表达式,则必须用一个问号‘?’来表示; 4、 在定义语句的后面可以书写注释内容,也可以不写。
在定义变量时,虽然可以不写变量名,但我们建议还是要写,因为不写变量名,就意味着只能用内存单元的偏移量来访问它。这时,一旦内存单元的偏移量发生变化,那么,程序中的所有引用都要修改,这不仅增加了程序维护的工作量,而且也容易因遗漏修改而出错。
4.2.2 字节变量
定义字节变量的定义符为DB/BYTE(Define Byte),每个字节只占一个字节单元。其中:BYTE是MASM 6.0及其以后版本的数据类型说明符,随后的其它类型说明符同此说明。
例如:
COUNTER DB 6 DB 'A', 'D', 0Dh, '$'
TABLE DB 1, 3, 5, 7, 9, 11
上面的定义语句经汇编后所产生出的内存单元分配情况如图4.1所示。图中的数据是用十六进制表示的(以后也如此,不再说明),由引号括起来的字符在内存中是存放其ASCII码值。所以,'D'和0Dh是不同的,前者是字符'D',后者是数值12的十六进制编码。
图4.1 内存单元的分配情况示意图
注意:在上例中,说明语句“DB 'A', 'D', 0Dh, '$'”之前并没有给出变量名,但我们可以从前面的变量名COUNTER一直往后数,或从TABLE往前数,来访问某存储单元,因为它们是一片连续的存储单元,这和高级语言的变量定义有点区别的。在高级语言中,我们一定要用某个标识符来说明变量,也必须用该变量名来访问其所对应的存储单元。
用定义符DB还可定义一种特殊的数据形式——字符串。在定义字符串时,必须用成对的单引号或双引号把所要的字符括起来,括号内字符的ASCII码将依次存放在相应的字节单元内。例如:
MSG1 DB 'I am a student.'
该说明语句所对应的存储单元分布如下所示。为了看起来方便,并没有用字符的ASCII码来存放在相应的存储单元内,而直接用该字符,请不要引起误解。
… | 'I' | ' ' | 'a' | 'm' | ' ' | 'a' | ' ' | 's' | 't' | 'u' | 'd' | 'e' | 'n' | 't' | … |
---|
上面的例子也可改写为另一种等价的语句:
MSG1 DB 'I', ' ', 'a', 'm', ' ', 'a', ' ', 's', 't', 'u', 'd', 'e', 'n', 't', '.'
显然,前者的说明要比后者方便得多,所以,在程序中都采用前者的书写方式。
4.2.3 字变量
定义字变量的定义符为DW/WORD(Define Word),每个字占用两个连续的字节单元。
例如:
Word1 DW 89H, 1909H, -1 DW 0abcdH, ?, 0
上述定义的内存分配如下所示。
… | 89 | 00 | 09 | 19 | FF | FF | CD | AB | -- | -- | 00 | 00 | … |
---|
由于字变量的数据是按照“高高低低”的原则存于存储单元之中的,而字节数据是按照排列顺序存于存储单元中的,所以,它们的存储方式有所不同。
试比较下面两个定义的存储顺序,其中:41H和42H分别是'A'和'B'的ASCII码。
B1 DB 'AB'
W1 DW 'AB'
… | 41h | 42h | 42h | 41h | … |
---|
4.2.4 双字变量
定义双字变量的定义符为DD/DWORD(Define Doubleword),每个双字变量占用二个连续的字单元(四个字节)。
DW1 DD 12345678H, ? DW2 DD 0abcd1243H
上述定义的内存分配如下所示。
… | 78 | 56 | 34 | 12 | -- | -- | -- | -- | 43 | 12 | CD | AB | … |
---|
4.2.5 六字节变量 定义六字节变量的定义符为DF/FWORD(Define Farword)。顾名思义,每个六字节变量占用六个连续的字节。
DF1 DF 1234567890abH, -1 DF 1abcd23H
上述定义的内存分配如下所示。
… | abH | 90H | 78H | 56H | 34H | 12H | 0FFH | 0FFH | 0FFH | 0FFH | 0FFH | 0FFH | 23hH | 0cdH | 0abH | 01H | 00H | 00H | … |
---|
(占6个字节)
4.2.6 八字节变量 定义八字节变量的定义符为DQ/QWORD(Define Quadword)。同理,每个八字节变量占用八个连续的字节。
DQ1 DQ 12345678H, 0H, -1234H DQ ?, 1238H, ?
第一个八字节常量12345678H在内存中的分配方式如下所示,其存储原则与前面相同。其它八字节常量的存储方式与此一致。
… | 78 | 56 | 34 | 12 | 00 | 00 | 00 | 00 | … |
---|
(占8个字节)
4.2.7 十字节变量 定义十字节变量的定义符为DT/TBYTE(Define Tenbytes)。同理,每个十字节变量占用十个连续的字节。
DT1 DT 12345678H, 0H, -1234H DT2 DT ?, -1H
第一个十字节常量12345678H在内存中的分配方式如下所示,它同样按“高高低低”的原则来存储。其它十字节常量的存储方式与此一致。
… | 78 | 56 | 34 | 12 | 00 | 00 | 00 | 00 | 00 | 00 | … |
---|
以上六个数据类型是汇编语言中最基本的数据类型,其中,前三个是在程序中经常使用的,后三个的使用频率不太高。