从今天开始,我们介绍Perl在ASIC应用中的高级篇。高级篇主要介绍正则表达式、module、package、面向对象、进程等。
正则表达式最常见的有两个应用,高级查找和替换。而替换的核心部分也是查找。
那么,我们如何定义这个查找(或者说叫匹配)的规则。匹配的基本语法是:
m/.../
匹配规则就写在m开头的两个斜杠之间。
定义规则中的特殊字符称为元字符。元字符有以下这些(只列了常用的,基本够用了):
分类一:(转义)
反斜杠加接元字符表示转义,比如 , *, ?等,表示这些字符本身
b 匹配单词边界
B 非单词边界
d 数字,就是0-9中的任一个字符
D 非数字
w 匹配大小写字母和下划线
W 非大小写字母和下划线
s 匹配空白字符,包括空格、制表符等
S 非空白字符
n 换行符,ASCII的0x0A
t 制表符
x x后接十六进制数,匹配这个数的ASCII符号
分类二:
^ 匹配开头
$ 匹配结尾
. 区配除换行符以外的所有字符
分类三:(匹配次数)
* 匹配零次或多次
匹配一次或多次
? 匹配零次或一次
分类四:括号(), [], {}
() 圆括号表示取值,把()里的值存到$1, $2, ... , $n里
[] 表示多选一。如[abc]匹配a或b或c。连续的字符可以简写,如[a-z],[0-9]
[^] 表示[]里列出的其它字符
{n} 匹配n次
{n,m} 匹配n到m次
| 分组,如m/bill|mike/,表示bill或mike
? 当?跟在*, ,?等后面时,表示非贪婪模式。如,
my $test = "aaaaabb";
$test =~ m/a ?/;
匹配的结果是"a",而不是"aaaaa"
Perl的绑定操作符
=~ 表示满足匹配
!~ 表示不满足匹配
如:
if($tc =~ m/^tc_/){ ... } 表示如果$tc变量以tc_开头,则执行{}里的语句。
if($tc !~ m/^tc_/){ ... } 表示如果$tc变量不以tc_开头,则执行{}里的语句。
正则表达式的匹配模式
i 忽略大小写
m 多行处理,即字符串中的换行符把字符串分为多行。匹配时不能越行
s 单行处理,在这个模式下,元字符.可以匹配换行符
x 允许正则表达式换行和加注释,忽略空白字符
g 查到全局所有可能的匹配,即会匹配多次
e 用于替换,表示替换的新值要先计算,如
s/(ab c)/&replace($1)/e
表示查换ab c,并把找到的结果传给replace()函数,用函数的返回值来替换。这种方法可用于复杂的查找替换。这种用法,我在编辑APR的IO坐标文件时实际用过,比GVIM或者Emacs的列填充更强大。
下面举几个例子:
- m/(output|input|inout)s wire|regs*([.*])?(w ),/ 脚本提取RTL端口定义
- s/s*(w )s*/.$1tt($1)/ 可用来模块例化时,自动连接端口
- my @testcase = `ls`;
foreach my $tc (@testcase){
if($tc =~ m/^tc_/){
... #查找目录下的"tc_"开头所有的文件名,在写仿真脚本时常用到
}
}
4. if($pwd =~ m//(trunk|tags|release)$/){
... #通过脚本确认当前目录是否是项目根目录
}
Perl正则表达式是非常博大精深的,需要在工作中慢慢积累。所以,今天的练习题多一点,主要是想多提供一些实际使用场景,并自己动手解决问题。
练习题:
1. 用正则表达式从RTL里抓取所有寄存器的路径。(用于自动产生UVM寄存器模型)
2. 用正则表达式把门级网表拆分成多个仅包含单个module的文件。
答案:http://www.exasic.com/example/split_netlist.zip
3. 用正则表达式把PR网表中大小写敏感的net改成大小写不敏感。(用于calibre做LVS)
下一次,我们将开始介绍module。
感谢你对ExASIC的关注,欢迎转载或转发。
--------------------
欢迎关注ExASIC. 分享芯片数字集成电路设计中的经验和方法。Sharing makes work smoother.