宏用来处理重复工作最好,比如你需要跑10个回归,用proc reg...,这10个回归其他都一样,就是因变量y每次需要换。那么将回归程序写成一个宏,每次用的时候换参数就可以了。
总之,宏可以降低重复性工作的任务量,使程序模块化。
本节目录:
7.1 宏概述
7.2 用宏变量提交文本
7.3 用宏创建一个模块化的代码
7.4 给宏增加参数
7.5 使用条件逻辑写宏
7.6 用call symput编写数据驱动程序
7.7 排除宏错误的bug
【SAS Says】基础篇:7. SAS宏初步
7.1 宏概述
宏以前被认为是经验老道的SAS程序员使用的高级技术。但现在新手也能够了解一些。幸运的是,宏的基本功能不是那么难理解。本章介绍的最普遍使用的SAS宏语言的特征。
宏处理器 标准SAS程序中,提交程序后,SAS就编译并立即执行。但宏语句多了一步,在提交之后,SAS会将宏语句传送到宏处理器上,将其转变为SAS标准代码,通常叫做“变换代码”(meta-programming.)
宏和宏变量 SAS宏代码包括两个基本部分:宏命令和宏变量。宏变量通常加一个“&”作为前缀,而宏命令通常加一个“%”作为前缀。
局部VS全局 宏变量有局部宏变量和全局宏变量。如果在宏的内部定义则为局部宏变量,只能在内部使用。如果在开放代码中定义则为全局宏变量。避免两种错误:在宏之外(开放代码)使用局部变量;创建同名的局部变量和全局变量。
启动宏处理器 使用宏指令之前必须将宏系统选项打开,尽管有时默认是打开的。可以用下面代码查看是否打开:
PROC OPTIONS OPTION=MACRO;
RUN;
查看日志,如果看到MACRO,则打开了;如果看到NOMACRO,则没有打开。
避免宏错误 宏会让人很头痛,可以通过分段形式避免。首先,用SAS标准语言写下程序;接着,将其转变为宏代码。
7.2 用宏变量提交文本
用%let创建一个宏变量 最简单给宏变量分配一个值的方法是%let,基本形式为:
%LET macro-variable-name=value;
宏变量名必须符合SAS命名法则,(少于等于32字节、以字母或下划线开头、只能包括字母、数字和下划线),下面创建了宏变量:
%LET iterations=10;
%LET country=New Zealand;
当赋值字符串时,不需要加引号。除非开头和结尾的空格,否则从等号到分号的全部内容都是变量值。
使用宏变量 宏变量前面要加前缀&,注意宏处理器找不到单引号内的宏变量,只能用双引号。如下的例子:
DO i=1 to &iterations;
TITLE ”Addresses in &country”;
经宏处理器编译后,语句变成:
DO i=1 to 10;
TITLE ”Addresses in New Zealand”;
例子 一份关于花店销售的数据,变量为顾客ID,销售日期,花的种类,数量:
想要一份反映某一种类型花的销售情况数据,宏变量就可以不用编辑数据步和过程步来选择一种花种:
结果如下:
7.3 用宏创建一个模块化的代码
宏可以使一段代码在一个或多个程序中被反复使用,而不需要重复的去编写相同或相似的代码。基本形式为:
%MACRO macro-name;
macro-text
%MEND macro-name;
%MACRO语句告诉SAS这是宏开始,而%MEND则意味着结束。macro-name是自己命名的,但mend后面的macro-name则是可选的,但加入会使得句子好很多(easier to debug and maintain)。
启动宏 定义了宏之后,可以通过在宏名称前面增加%来启动宏:%macro-name,注意这里可以不用分号。
例子 使用前面花店销售的数据:
下面的代码创建了一个名为%SAMPLE的宏,来将数据按照Quantity排序,打印出最大销售额的五个观测值。然后用标准数据步读取数据,并启动宏:
结果为:
这样的宏有些限制,因为它只能做一件事。现在结合%let语句,并增加参数使得其更加灵活
宏自动呼叫库 本书中的宏仅在一个程序内部定义和启动。也可以将宏储存在一个中心位置,叫做自动呼叫库,被各个程序分享。具体来说,将宏作为文件储存在某路径中,或作为分区数据集中的一员。使用MAUTOSOURCE和SASAUTOS=系统选项告诉SAS在哪里查找宏。之后,即使宏没有出现在程序中,也可以启动它了。
7.4 给宏增加参数
参数就是宏的变量,给宏增加参数,在%MACRO语句中的括号内列出宏变量的名字。基本形式为:
%MACRO macro-name(para-1=,para-2=,...para-n=);
macro-text
%MEND macro-name;
比如,一个叫做%QuarterlyRepott的宏可能这样开始:
%MACRO QuarterlyReport(quarter=,salesrep=);
这个宏有两个参数&QUARTER 和&SALESREP。启用这个宏可以用这样的语句:
%quarterlyreport(quarter=3,salesrep=Smith)
例子 仍然是花店销售例子:
现在需要一份报告,反映每位对每位顾客的销售。下面的代码定义了宏%SELECT,并启动两次。这个宏排序并打印数据FlowerSales,使用参数创造了两位命为&CUSTOMER和&SORTVAR的宏变量:
结果为:
7.5 使用条件逻辑写宏代码
在宏中使用条件逻辑的基本形式为:
%IF condition%THEN action;
%ELSE%IF condition%THEN action;
%ELSE action;
%IF condition%THEN%DO;
SAS statements
%END;
自动宏变量 每一次启动SAS,宏处理器自动创建一些宏变量,可以使用在程序中。最常见的有:
比如,可以像这样结合自动宏变量和条件逻辑语句:
%IF &SYSDAY=Tuesday %THEN %LETcountry=Belgium;
%ELSE %LET country=France;
例子 仍然是花店销售数据:
现在想在周一和周四的时候打印报告,代码如下:
当程序提交之后,宏处理器将会写下如下代码:
如果这段代码是周四写的,那么结果如下:
7.6 用call symput编写数据驱动的程序
分配一个值给宏变量,可以使用callsymput:
CALL SYMPUT(”macro-variable-name”,value);
macro-variable-name是变量名,value可以是一个变量名,该变量的值将分配给macro-variable-name,也可以是一个用引号括起来的常量。
call symput通常在IF-THEN语句中使用:
IF Age>=18 THEN CALL SYMPUT(”status”,”Adult”);
ELSE CALL SYMPUT(”status”,”Minor”);
这个语句创建了宏变量&STATUS,并依据年龄情况分配给值adult或minor。下面的代码使用变量来赋值:
IF TotalSales>1000000 THEN CALL SYMPUT(”bestseller”,BookTitle);
注意 用call symput创建的宏变量与赋值变量不能够用在同一个数据步中。因为直到数据步执行之后,SAS才会将一个值赋给宏变量。
例子 仍然是花店销售的数据:
现在想找到单个订单最大的客户,并打印出这个客户的所有订单。
第一段代码读取原始数据,proc sort按照quantity降序排序,最大单个订单将会出现在第一个观测值上。
第二段代码使用call symput,当_N_为1 的时候,分配变量CustomerID的值给宏变量&SELECTEDCUSTOMER,在数据步中,我们所需要的就是这么多,因此使用stop语句告诉SAS停止数据步。Stop语句也可以不要,但为了提高效率,它可以告诉SAS不要再读取下面的观测值了。
第三段代码,此时SAS直到数据步已经结束,因此执行数据步。宏变量&SELECTEDCUSTOMER的值为356W,结果如下:
7.7 排除宏错误的bug
避免宏错误 尽可能先用标准SAS代码写你的程序,当没有错误了,再转成宏代码,先一次增加一个宏逻辑特征。再增加%macro和%mend。再增加宏变量。
引用问题 宏处理器不能解决但引号内的宏。所以要使用双引号。比如下面的例子,单引号不能读取宏变量的值:
排除宏错误bug的系统选项 这五个系统选项会影响SAS写入日志的信息。粗体为默认的设置。
- MERROR|NOMERROR 如果你调用了一个SAS不能找到的宏,则会报警。
- SERROR|NOSERROR 如果你使用了一个SAS不能找到的宏,则会报警。
- MLOGIC|NOMLOGIC SAS会在日志里打印关于执行宏的详细信息。
- MPRINT|NOMPRINT SAS在日志里打印由宏产生的标准SAS代码。
- SYMBOLGEN|NOSYMBOLGEN SAS在日志里打印宏变量的值。
最好只在排除bug的时候才将MLOGIC,MPRINT和SYMBOLGEN打开,否则它会让你的日志阅读起来很困难。想要关闭,则用系统语句:
OPTIONS MPRINT NOSYMBOLGEN NOMLOGIC;
Merror信息 如果SAS不能找到一个宏,并且Merror选项也是开着的,那么SAS会打印这样的信息:
WARNING:Apparent invocation of macro SAMPL not resolved.
确认宏名字的拼写是否正确。
SERROR信息 如果SAS不能在开放代码中处理一个宏变量,并且serror选项是开着的,SAS会打印这样的信息:
WARNING:Apparent symbolic reference FLOWER not resolved.
首先确认是否拼写错误,再次查看视角,即是否在外部使用了一个局部变量。
MLOGIC信息 如果这个选项开启,SAS会在日志中打印由宏产生的SAS语句。如果在MPRINT选项中运行了%SAMPLE,日志会如下所示;
SYMBOLGEN信息 如果这个选项开启,SAS会在日志窗口中打印每个宏变量的值。如果在SYMBOLGEN选项中运行%SAMPLE,日志会如下所示: