重要性
字符串处理基本功,无论面试算法还是工作都经常使用到。以下我们以一个算法 一个实际工作场景的形式来阐述字符串处理。
以下算法都来自leecode中国
反转字符串
先来做下原题 344
题反转字符串
原题目要求不允许额外空间原地反转。
代码语言:javascript复制输入:s = ["h","e","l","l","o"]
输出:["o","l","l","e","h"]
直接一个循环反转了。
代码语言:javascript复制func reverseString(s []byte) {
//双指针,一个放头一个放尾
i:=0
j:=len(s)-1
//反转这两个位置的元素
for i<j {
s[i],s[j]=s[j],s[i]
i
j--
}
}
如果是python
直接一个revert
就出来了,Go
得自己写确实麻烦。
拆分与合并字符串
题目直接传入就是字节数组,外部怎么处理呢?就是字符串和byte
的来回转换。
s := []byte(str)
reverseString(s)
fmt.Println(string(s))
这样会把字符串变成一个个字节,想象一个场景你的文章有多个标签,全部塞到一个字段里。要拆分显示怎么操作?
代码语言:javascript复制# 拆分
strList := strings.Split("Go语言,channel,并发", ",")
fmt.Println(strList)
# 合并
str := strings.Join(strList,",")
fmt.Println(str)
strings
是一个包,封装了很多字符串处理的函数。strings.Split
拆分,参数一是字符串,参数二是分割符strings.Join
合并,参数一是字符串数组,参数二是合并用的分割符
忽略大小写判等
一个验证码的场景,例如验证码是2s5G
用户输入2s5g
实际上也是对的。
全部转大写,或者全部转小写判等就行。我写粗糙一点,看不懂留言啊。
代码语言:javascript复制strings.ToLower("2s5G") == "2s5g"
strings.ToUpper("2s5G") == "2S5G"
当然strings
直接就提供了不区分大小写判断是否相等的办法。
fmt.Println(strings.EqualFold("abc", "ABC"))
蛇行命名转驼峰命名方式
涉及知识点:拆分、大小写转换、组合
代码语言:javascript复制func main() {
name := "ab_cde_as"
strList := strings.Split(name,"_")
for index,str := range strList{
strList[index] = strings.ToUpper(string(str[0])) str[1:]
}
name = strings.Join(strList,"")
fmt.Println(name)
}
- 输出
AbCdeAs
。 str[0]
取其中一个字符,str[1:]
切片取字符串,得到[1,len(str)]
位置闭区间的字符串。
当前可以直接用strings.Title("hello")
来得到Hello
。
替换和查找
替换和查找也是比较高频的操作。常见于配置替换,不过基本都用sed
命令搞定了。
strings.Replace("ip:10.1.1.1", "10.1.1.1", "0.0.0.0", -1)
最后一个是次数,-1
代表全部替换,如果只替换一次就是1
。
当前正常情况下不会那么蠢啦,都是用正则匹配的,比如我之前有个需求把所有的图片网址取出来,存到我的对象存储里面,再插入回去,我就写了一个程序。
我写个简单版的。测试一下正则是否匹配,输出ok
。
regexStr := "https*://[^\s]*(jpg|png)"
if ok, _ := regexp.MatchString(regexStr, "https://coding3min.com/abc.jpg"); ok {
fmt.Println("ok")
}
开始搞
代码语言:javascript复制data := `
![](http://coding3min.com/abc.jpg)
[](https://coding3min.com/abc.html)
![](https://coding3min.com/abc.png)
https://coding3min.com
`
re, _ := regexp.Compile(regexStr)
picList := re.FindAllString(data,-1)
sort.Strings(picList)
for k,v:=range picList{
if k!=0 && picList[k]==picList[k-1]{
continue
}
//省略改变图片链接
afterStr := "xxx"
re,_ = regexp.Compile(v)
data = re.ReplaceAllString(data,afterStr)
}
fmt.Println(data)
regexp.Compile(regexStr)
加载正则表达式。re.FindAllString(data,-1)
查找所有匹配的结果,参数二代表查找几个,-1
就是全部。返回一个list
。re.ReplaceAllString(data,afterStr)
替换全部原字符串中所有匹配的,为新字符串(参数二),返回替换完后的结果。- 至于倒数第四行为什么要再加载,是因为需要把当前图片当正则去匹配所有此图片内容。
- 至于为什么要排序,是为了去重,跳过重复匹配的部分。
其他速查
判断大小 1
前大 0
一样 -1
后大
strings.Compare("a", "b")
子串包含
代码语言:javascript复制fmt.Println(strings.Contains("hello", "he"))
返回子串出现的次数
代码语言:javascript复制fmt.Println(strings.Count("happy", "p"))
判断字符串是否以某子串开头、结尾
代码语言:javascript复制fmt.Println(strings.HasPrefix("hello", "he"))
fmt.Println(strings.HasSuffix("hello", "lo"))
返回字符串第一次出现的位置 不存在返回-1
代码语言:javascript复制fmt.Println(strings.Index("abandon already", "a"))
返回字符串最后一次出现的位置 不存在返回-1
代码语言:javascript复制fmt.Println(strings.LastIndex("abandon already", "a"))
其他
处理中文汉字使用utf8
包,就不展开说啦。