Go字符串操作不是你想的那么简单!

2023-03-02 15:19:22 浏览数 (1)

重要性

字符串处理基本功,无论面试算法还是工作都经常使用到。以下我们以一个算法 一个实际工作场景的形式来阐述字符串处理。

以下算法都来自leecode中国

反转字符串

先来做下原题 344题反转字符串

原题目要求不允许额外空间原地反转。

代码语言:javascript复制
输入:s = ["h","e","l","l","o"]
输出:["o","l","l","e","h"]

直接一个循环反转了。

代码语言:javascript复制
func reverseString(s []byte)  {
    //双指针,一个放头一个放尾
    i:=0 
    j:=len(s)-1
    //反转这两个位置的元素
    for i<j {
        s[i],s[j]=s[j],s[i]
        i  
        j--
    }
    
}

如果是python直接一个revert就出来了,Go得自己写确实麻烦。

拆分与合并字符串

题目直接传入就是字节数组,外部怎么处理呢?就是字符串和byte的来回转换。

代码语言:javascript复制
s := []byte(str)
reverseString(s)
fmt.Println(string(s))

这样会把字符串变成一个个字节,想象一个场景你的文章有多个标签,全部塞到一个字段里。要拆分显示怎么操作?

代码语言:javascript复制
# 拆分
strList := strings.Split("Go语言,channel,并发", ",")
fmt.Println(strList)
# 合并
str := strings.Join(strList,",")
fmt.Println(str)
  • strings 是一个包,封装了很多字符串处理的函数。
  • strings.Split 拆分,参数一是字符串,参数二是分割符
  • strings.Join 合并,参数一是字符串数组,参数二是合并用的分割符

忽略大小写判等

一个验证码的场景,例如验证码是2s5G 用户输入2s5g实际上也是对的。

全部转大写,或者全部转小写判等就行。我写粗糙一点,看不懂留言啊。

代码语言:javascript复制
strings.ToLower("2s5G") == "2s5g"
strings.ToUpper("2s5G") == "2S5G"

当然strings直接就提供了不区分大小写判断是否相等的办法。

代码语言:javascript复制
fmt.Println(strings.EqualFold("abc", "ABC"))

蛇行命名转驼峰命名方式

涉及知识点:拆分、大小写转换、组合

代码语言:javascript复制
func main() {
 name := "ab_cde_as"
 strList := strings.Split(name,"_")
 for index,str := range strList{
  strList[index] = strings.ToUpper(string(str[0]))   str[1:]
 }
 name = strings.Join(strList,"")
 fmt.Println(name)
}
  • 输出 AbCdeAs
  • str[0] 取其中一个字符,str[1:]切片取字符串,得到[1,len(str)]位置闭区间的字符串。

当前可以直接用strings.Title("hello")来得到Hello

替换和查找

替换和查找也是比较高频的操作。常见于配置替换,不过基本都用sed命令搞定了。

代码语言:javascript复制
strings.Replace("ip:10.1.1.1", "10.1.1.1", "0.0.0.0", -1)

最后一个是次数,-1代表全部替换,如果只替换一次就是1

当前正常情况下不会那么蠢啦,都是用正则匹配的,比如我之前有个需求把所有的图片网址取出来,存到我的对象存储里面,再插入回去,我就写了一个程序。

我写个简单版的。测试一下正则是否匹配,输出ok

代码语言:javascript复制
regexStr := "https*://[^\s]*(jpg|png)"
 if ok, _ := regexp.MatchString(regexStr, "https://coding3min.com/abc.jpg"); ok {
  fmt.Println("ok")
 }

开始搞

代码语言:javascript复制
data := `
![](http://coding3min.com/abc.jpg)
[](https://coding3min.com/abc.html)
![](https://coding3min.com/abc.png)
https://coding3min.com
`
 re, _ := regexp.Compile(regexStr)
 picList := re.FindAllString(data,-1)
 sort.Strings(picList)
 for k,v:=range picList{
  if k!=0 && picList[k]==picList[k-1]{
   continue
  }
  //省略改变图片链接
  afterStr := "xxx"
  re,_ = regexp.Compile(v)
  data = re.ReplaceAllString(data,afterStr)
 }
 fmt.Println(data)
  • regexp.Compile(regexStr) 加载正则表达式。
  • re.FindAllString(data,-1) 查找所有匹配的结果,参数二代表查找几个,-1就是全部。返回一个list
  • re.ReplaceAllString(data,afterStr) 替换全部原字符串中所有匹配的,为新字符串(参数二),返回替换完后的结果。
  • 至于倒数第四行为什么要再加载,是因为需要把当前图片当正则去匹配所有此图片内容。
  • 至于为什么要排序,是为了去重,跳过重复匹配的部分。

其他速查

判断大小 1 前大 0 一样 -1 后大

代码语言:javascript复制
strings.Compare("a", "b")

子串包含

代码语言:javascript复制
fmt.Println(strings.Contains("hello", "he"))

返回子串出现的次数

代码语言:javascript复制
fmt.Println(strings.Count("happy", "p")) 

判断字符串是否以某子串开头、结尾

代码语言:javascript复制
fmt.Println(strings.HasPrefix("hello", "he"))
fmt.Println(strings.HasSuffix("hello", "lo"))

返回字符串第一次出现的位置 不存在返回-1

代码语言:javascript复制
fmt.Println(strings.Index("abandon already", "a")) 

返回字符串最后一次出现的位置 不存在返回-1

代码语言:javascript复制
fmt.Println(strings.LastIndex("abandon already", "a"))

其他

处理中文汉字使用utf8包,就不展开说啦。

0 人点赞