【SAS Says】基础篇:SAS宏初步

2018-04-04 16:07:16 浏览数 (1)

特别说明:本节【SAS Says】基础篇:SAS宏初步,用的是数说君学习《The little SAS book》时的中文笔记,我们认为这是打基础的最好选择。

转载请在文章开头注明微信号:shushuojun,谢谢!

宏用来处理重复工作最好,比如你需要跑10个回归,用proc reg...,这10个回归其他都一样,就是因变量y每次需要换。那么将回归程序写成一个宏,每次用的时候换参数就可以了。

总之,宏可以降低重复性工作的任务量,使程序模块化。

本节目录:

1. 宏概述

2. 用宏变量提交文本

3. 用宏创建一个模块化的代码

4. 给宏增加参数

5. 使用条件逻辑写宏

6. 用call symput编写数据驱动程序

7. 排除宏错误的bug


【SAS Says】基础篇:SAS宏初步

1. 宏概述

宏以前被认为是经验老道的SAS程序员使用的高级技术。但现在新手也能够了解一些。幸运的是,宏的基本功能不是那么难理解。本章介绍的最普遍使用的SAS宏语言的特征。

宏处理器 标准SAS程序中,提交程序后,SAS就编译并立即执行。但宏语句多了一步,在提交之后,SAS会将宏语句传送到宏处理器上,将其转变为SAS标准代码,通常叫做“变换代码”(meta-programming.)

宏和宏变量 SAS宏代码包括两个基本部分:宏命令和宏变量。宏变量通常加一个“&”作为前缀,而宏命令通常加一个“%”作为前缀。

局部VS全局 宏变量有局部宏变量和全局宏变量。如果在宏的内部定义则为局部宏变量,只能在内部使用。如果在开放代码中定义则为全局宏变量。避免两种错误:在宏之外(开放代码)使用局部变量;创建同名的局部变量和全局变量。

启动宏处理器 使用宏指令之前必须将宏系统选项打开,尽管有时默认是打开的。可以用下面代码查看是否打开:

PROC OPTIONS OPTION=MACRO;

RUN;

查看日志,如果看到MACRO,则打开了;如果看到NOMACRO,则没有打开。

避免宏错误 宏会让人很头痛,可以通过分段形式避免。首先,用SAS标准语言写下程序;接着,将其转变为宏代码。

2. 用宏变量提交文本

用%let创建一个宏变量 最简单给宏变量分配一个值的方法是%let,基本形式为:

%LET macro-variable-name=value;

宏变量名必须符合SAS命名法则,(少于等于32字节、以字母或下划线开头、只能包括字母、数字和下划线),下面创建了宏变量:

%LET iterations=10;

%LET country=New Zealand;

当赋值字符串时,不需要加引号。除非开头和结尾的空格,否则从等号到分号的全部内容都是变量值。

使用宏变量 宏变量前面要加前缀&,注意宏处理器找不到单引号内的宏变量,只能用双引号。如下的例子:

DO i=1 to &iterations;

TITLE ”Addresses in &country”;

经宏处理器编译后,语句变成:

DO i=1 to 10;

TITLE ”Addresses in New Zealand”;

例子 一份关于花店销售的数据,变量为顾客ID,销售日期,花的种类,数量:

想要一份反映某一种类型花的销售情况数据,宏变量就可以不用编辑数据步和过程步来选择一种花种:

结果如下:

3. 用宏创建一个模块化的代码

宏可以使一段代码在一个或多个程序中被反复使用,而不需要重复的去编写相同或相似的代码。基本形式为:

%MACRO macro-name;

macro-text

%MEND macro-name;

%MACRO语句告诉SAS这是宏开始,而%MEND则意味着结束。macro-name是自己命名的,但mend后面的macro-name则是可选的,但加入会使得句子好很多(easier to debug and maintain)。

启动宏 定义了宏之后,可以通过在宏名称前面增加%来启动宏:%macro-name,注意这里可以不用分号。

例子 使用前面花店销售的数据:

下面的代码创建了一个名为%SAMPLE的宏,来将数据按照Quantity排序,打印出最大销售额的五个观测值。然后用标准数据步读取数据,并启动宏:

结果为:

这样的宏有些限制,因为它只能做一件事。现在结合%let语句,并增加参数使得其更加灵活

宏自动呼叫库 本书中的宏仅在一个程序内部定义和启动。也可以将宏储存在一个中心位置,叫做自动呼叫库,被各个程序分享。具体来说,将宏作为文件储存在某路径中,或作为分区数据集中的一员。使用MAUTOSOURCE和SASAUTOS=系统选项告诉SAS在哪里查找宏。之后,即使宏没有出现在程序中,也可以启动它了。

4. 给宏增加参数

参数就是宏的变量,给宏增加参数,在%MACRO语句中的括号内列出宏变量的名字。基本形式为:

%MACRO macro-name(para-1=,para-2=,...para-n=);

macro-text

%MEND macro-name;

比如,一个叫做%QuarterlyRepott的宏可能这样开始:

%MACRO QuarterlyReport(quarter=,salesrep=);

这个宏有两个参数&QUARTER 和&SALESREP。启用这个宏可以用这样的语句:

%quarterlyreport(quarter=3,salesrep=Smith)

例子 仍然是花店销售例子:

现在需要一份报告,反映每位对每位顾客的销售。下面的代码定义了宏%SELECT,并启动两次。这个宏排序并打印数据FlowerSales,使用参数创造了两位命为&CUSTOMER和&SORTVAR的宏变量:

结果为:

5. 使用条件逻辑写宏代码

在宏中使用条件逻辑的基本形式为:

%IF condition%THEN action;

%ELSE%IF condition%THEN action;

%ELSE action;

%IF condition%THEN%DO;

SAS statements

%END;

自动宏变量 每一次启动SAS,宏处理器自动创建一些宏变量,可以使用在程序中。最常见的有:

比如,可以像这样结合自动宏变量和条件逻辑语句:

%IF &SYSDAY=Tuesday %THEN %LETcountry=Belgium;

%ELSE %LET country=France;

例子 仍然是花店销售数据:

现在想在周一和周四的时候打印报告,代码如下:

当程序提交之后,宏处理器将会写下如下代码:

如果这段代码是周四写的,那么结果如下:

6. 用call symput编写数据驱动的程序

分配一个值给宏变量,可以使用callsymput:

CALL SYMPUT(”macro-variable-name”,value);

macro-variable-name是变量名,value可以是一个变量名,该变量的值将分配给macro-variable-name,也可以是一个用引号括起来的常量。

call symput通常在IF-THEN语句中使用:

IF Age>=18 THEN CALL SYMPUT(”status”,”Adult”);

ELSE CALL SYMPUT(”status”,”Minor”);

这个语句创建了宏变量&STATUS,并依据年龄情况分配给值adult或minor。下面的代码使用变量来赋值:

IF TotalSales>1000000 THEN CALL SYMPUT(”bestseller”,BookTitle);

注意 用call symput创建的宏变量与赋值变量不能够用在同一个数据步中。因为直到数据步执行之后,SAS才会将一个值赋给宏变量。

例子 仍然是花店销售的数据:

现在想找到单个订单最大的客户,并打印出这个客户的所有订单。

第一段代码读取原始数据,proc sort按照quantity降序排序,最大单个订单将会出现在第一个观测值上。

第二段代码使用call symput,当_N_为1 的时候,分配变量CustomerID的值给宏变量&SELECTEDCUSTOMER,在数据步中,我们所需要的就是这么多,因此使用stop语句告诉SAS停止数据步。Stop语句也可以不要,但为了提高效率,它可以告诉SAS不要再读取下面的观测值了。

第三段代码,此时SAS直到数据步已经结束,因此执行数据步。宏变量&SELECTEDCUSTOMER的值为356W,结果如下:

7. 排除宏错误的bug

避免宏错误 尽可能先用标准SAS代码写你的程序,当没有错误了,再转成宏代码,先一次增加一个宏逻辑特征。再增加%macro和%mend。再增加宏变量。

引用问题 宏处理器不能解决但引号内的宏。所以要使用双引号。比如下面的例子,单引号不能读取宏变量的值:

排除宏错误bug的系统选项 这五个系统选项会影响SAS写入日志的信息。粗体为默认的设置。

  • MERROR|NOMERROR 如果你调用了一个SAS不能找到的宏,则会报警。
  • SERROR|NOSERROR 如果你使用了一个SAS不能找到的宏,则会报警。
  • MLOGIC|NOMLOGIC SAS会在日志里打印关于执行宏的详细信息。
  • MPRINT|NOMPRINT SAS在日志里打印由宏产生的标准SAS代码。
  • SYMBOLGEN|NOSYMBOLGEN SAS在日志里打印宏变量的值。

最好只在排除bug的时候才将MLOGIC,MPRINT和SYMBOLGEN打开,否则它会让你的日志阅读起来很困难。想要关闭,则用系统语句:

OPTIONS MPRINT NOSYMBOLGEN NOMLOGIC;

Merror信息 如果SAS不能找到一个宏,并且Merror选项也是开着的,那么SAS会打印这样的信息:

WARNING:Apparent invocation of macro SAMPL not resolved.

确认宏名字的拼写是否正确。

SERROR信息 如果SAS不能在开放代码中处理一个宏变量,并且serror选项是开着的,SAS会打印这样的信息:

WARNING:Apparent symbolic reference FLOWER not resolved.

首先确认是否拼写错误,再次查看视角,即是否在外部使用了一个局部变量。

MLOGIC信息 如果这个选项开启,SAS会在日志中打印由宏产生的SAS语句。如果在MPRINT选项中运行了%SAMPLE,日志会如下所示;

SYMBOLGEN信息 如果这个选项开启,SAS会在日志窗口中打印每个宏变量的值。如果在SYMBOLGEN选项中运行%SAMPLE,日志会如下所示:


sas

0 人点赞