GO语言实战之类型的本质

2023-01-30 15:58:39 浏览数 (1)

写在前面

  • 内容为《GO语言实战》读书笔记之一
  • 嗯,能力有限,书里讲的很多读不大懂,也不知是翻译的原因,嘻,读着很拗口
  • 比如这个类型的值做增加或者删除的操作这句
  • 我们平常可能会讲,这个类型的值做修改的操作
  • 整理一下,其实还是不太懂,明白了GO类型的本质,才可以定义合适的类型,并正确的使用,感觉是需要代码量来体会的,理解不足请小伙伴帮忙指正
  • 主要涉及内容
    • 用户类型如何接收方法
    • 内置类型在方法和函数的传递
    • 引用类型在方法和函数的传递

「 傍晚时分,你坐在屋檐下,看着天慢慢地黑下去,心里寂寞而凄凉,感到自己的生命被剥夺了。当时我是个年轻人,但我害怕这样生活下去,衰老下去。在我看来,这是比死亡更可怕的事。--------王小波」


类型的本质

在声明一个新类型之后,声明一个该类型的方法之前,需要先回答一个问题:这个类型的本质是什么。

如果给这个类型增加或者删除某个值,是要创建一个新值,还是要更改当前的值?

如何接收方法

「如果是要创建一个新值,该类型的方法就使用值接收者。如果是要修改当前值,就使用指针接收者。」

  • 当调用使用指针接收者声明的方法时,这个方法会共享调用方法时接收者所指向的值,即对于接收者来讲,始终是一个值,方法可以理解对接收者的加工,也可以说,当对接收者进行加工生产时,一般使用指针接收方法。
  • 当调用使用值接收者声明的方法时,会使用这个值的一个副本来执行,即用于消费这个接收者,不会对原有接收有影响。

需要说明的是GOlang对方法的调用者很宽松,既允许使用值,也允许使用指针来调用方法,不必严格符合接收者的类型。

代码语言:javascript复制
// 值传递
func (u user) notify() {
 fmt.Printf("Sending User Email To %s<%s>n",
  u.name,
  u.email)
}
// 指针传递
func (u *user) changeEmail(email string) {
 u.email = email
}

这个答案也会影响程序内部传递这个类型的值的方式:是按值做传递,还是按指针做传递

「保持传递的一致性很重要」 。这个背后的原则是,不要只关注某个方法是如何处理这个值,而是要关注这个值的本质是什么。

内置类型在方法和函数的传递

内置类型是由语言提供的一组类型,数值类型字符串类型布尔类型,这些类型本质上是原始的类型,因此,当对这些值进行增加或者删除的时候,会创建一个新值.即通过基本类似通过值传递的方式。

基于这个结论,「当把内置类型 的值传递给方法或者函数时,应该传递一个对应值的副本,即使用值传递

代码语言:javascript复制
func Trim(s, cutset string) string {
 if s == "" || cutset == "" {
  return s
 }
 return TrimFunc(s, makeCutsetFunc(cutset))
}

标准库strings 包的 Trim 函数,这个函数对调用者原始的string值的一个副本做操作,并返回一个新的string值的副本。字符串(string)就像整数、浮点数和布尔值一样,本质上是一种很原始的数据值,所以在函数或方法内外传递时,要传递字符串的一份副本

代码语言:javascript复制
func isShellSpecialVar(c uint8) bool {
 switch c {
 case '*', '#', '$', '@', '!', '?', '-', '0', '1', '2', '3', '4', '5', '6', '7', '8', '9':
  return true
 }
 return false
}

env 包里的 isShellSpecialVar 函数。这个函数传入了一个 int8类型的值,并返回一个bool 类型的值,这里的参数没有使用指针来共享参数的值,调用者传入了一个uint8值的副本,接受一个返回值 true 或者 false。(go里面是支持switch的,但是python是不支持的)

引用类型在方法和函数的传递

Go 语言里的引用类型有如下几个:切片、映射、通道、接口和函数类型

当声明上述类型的变量时,创建的变量被称作标头(header)值。从技术细节上说,字符串也是一种引用类型

每个引用类型创建的标头值是包含一个指向底层数据结构的指针。每个引用类型还包含一组独特的字段,用于管理底层数据结构。因为标头值是为复制而设计的,所以永远不需要共享一个引用类型的值。类似Linux里面软链接的作用。

标头值里包含一个指针,因此通过复制来传递一个引用类型的值的副本,本质上就是在共享底层数据结构

通过已有类型声明一个用户定义类型IP

代码语言:javascript复制
type IP []byte  //名为 IP 的类型,这个类型被声明为字节切片
......

当要围绕相关的内置类型或者引用类型来声明方法时,直接基于已有类型来声明用户定义的类型(结构体)会很好用。因为编译器只允许为用户定义的类型声明方法.

代码语言:javascript复制
func (ip IP) MarshalText() ([]byte, error) {
 if len(ip) == 0 {
  return []byte(""), nil
 }
 if len(ip) != IPv4len && len(ip) != IPv6len {
  return nil, &AddrError{Err: "invalid IP address", Addr: hexString(ip)}
 }
 return []byte(ip.String()), nil
}

MarshalText 方法是用 IP 类型的值接收者声明的。一个值接收者,即IP对象通过复制来传递引用类型,从而不需要通过指针来共享引用类型的值。

这种传递方法也可以应用到函数或者方法的参数传递

代码语言:javascript复制
func ipEmptyString(ip IP) string {
 if len(ip) == 0 {
  return ""
 }
 return ip.String()
}

ipEmptyString 函数。这个函数需要传入一个 IP 类型的值。「调用者传入的是这个引用类型的值,而不是通过引用共享给这个函数」 ,这里和方法有着本质的区别,调用者将引用类型的值的副本传入这个函数。

这种方法也适用于函数的返回值。最后要说的是,引用类型的值在其他方面像原始的数据类型的值一样对待。

结构类型(用户定义类型)

「结构类型可以用来描述一组数据值,这组值的本质即可以是原始的,也可以是非原始的

原始的情况

如果决定修改某个结构类型的值时,该结构类型的值不应该被更改,需要遵守之前提到的内置类型引用类型的规范。

简单来讲。对于一些结构体的值。可以看做是find的,不可被修改,只能创建返回一个新值, 所有使用值接收行为,我们看一个Time结构体的Demo

代码语言:javascript复制
type Time struct {
 // wall and ext encode the wall time seconds, wall time nanoseconds,
 // and optional monotonic clock reading in nanoseconds.
 //
 // From high to low bit position, wall encodes a 1-bit flag (hasMonotonic),
 // a 33-bit seconds field, and a 30-bit wall time nanoseconds field.
 // The nanoseconds field is in the range [0, 999999999].
 // If the hasMonotonic bit is 0, then the 33-bit field must be zero
 // and the full signed 64-bit wall seconds since Jan 1 year 1 is stored in ext.
 // If the hasMonotonic bit is 1, then the 33-bit field holds a 33-bit
 // unsigned wall seconds since Jan 1 year 1885, and ext holds a
 // signed 64-bit monotonic clock reading, nanoseconds since process start.
 wall uint64
 ext  int64

 // loc specifies the Location that should be used to
 // determine the minute, hour, month, day, and year
 // that correspond to this Time.
 // The nil location means UTC.
 // All UTC times are represented with loc==nil, never loc==&utcLoc.
 loc *Location
}

Time 结构选自 time 包,时间点的时间是不能修改的,看下Now 函数的实现

代码语言:javascript复制
//func now() (sec int64, nsec int32, mono int64)
func Now() Time {
 sec, nsec, mono := now()
 mono -= startNano
 sec  = unixToInternal - minWall
 if uint64(sec)>>33 != 0 {
  return Time{uint64(nsec), sec   minWall, Local}
 }
 return Time{hasMonotonic | uint64(sec)<<nsecShift | uint64(nsec), mono, Local}
}

这个函数创建了一个Time类型的值,并给调用者返回了Time值的副本。这个函数没有使用指针来共享Time值。即我们对于原始类型,行为一般通过值接收,让我们来看一个 Time 类型的方法

代码语言:javascript复制
func (t Time) Add(d Duration) Time {
 dsec := int64(d / 1e9)
 nsec := t.nsec()   int32(d9)
 if nsec >= 1e9 {
  dsec  
  nsec -= 1e9
 } else if nsec < 0 {
  dsec--
  nsec  = 1e9
 }
 t.wall = t.wall&^nsecMask | uint64(nsec) // update nsec
 t.addSec(dsec)
 if t.wall&hasMonotonic != 0 {
  te := t.ext   int64(d)
  if d < 0 && te > t.ext || d > 0 && te < t.ext {
   // Monotonic clock reading now out of range; degrade to wall-only.
   t.stripMono()
  } else {
   t.ext = te
  }
 }
 return t
}

这个方法使用值接收者,并返回了一个新的 Time 值,该方法操作的是调用者传入的 Time 值的副本,并且给调用者返回了一个方法内的 Time 值的副本。

至于是使用返回的值替换原来的 Time 值,还是创建一个新的 Time 变量来保存结果,是由调用者决定的事情。

非原始的情况

大多数情况下,结构类型的本质并不是原始的,而是非原始的。这种情况下,对这个类型的值做修改操作应该更改值本身。

当需要修改值本身时,在程序中其他地方,需要使用指针来共享这个值。让我们看一个由标准库中实现的具有非原始本质的结构类型的例子

「Gosrcostypes.go」

代码语言:javascript复制
//D:Gosrcostypes.go
type File struct {
 *file // os specific
}

「Gosrcosfile_windows.go」

代码语言:javascript复制

//file 是*File 的实际表示
// 额外的一层结构保证没有哪个系统的客户端
// 能够覆盖这些数据。如果覆盖这些数据,
// 可能在变量终结时关闭错误的文件描述符
type file struct {
 pfd        poll.FD
 name       string
 dirinfo    *dirInfo // 除了目录结构,此字段为 nil
 appendMode bool     // whether file is opened for appending
}

标准库中声明的 File 类型。这个类型的本质是非原始的,这个类型的值实际上不能安全复制(可以理解为没有读锁)。因为没有方法阻止程序员进行复制,所以File类型的实现使用了一个嵌入的指针,指向一个未公开的类型.正是这层额外的内嵌类型阻止了复制。

我理解通过指针内嵌的方式,对File私有化,在多重读写中,保证了文件不被覆盖。

不是所有的结构类型都需要或者应该实现类似的额外保护。程序员需要能识别出每个类型的本质,并使用这个本质来决定如何组织类型。

Open 函数的实现

代码语言:javascript复制
func Open(name string) (*File, error) {
 return OpenFile(name, O_RDONLY, 0)
}

调用者得到的是一个指向 File 类型值的指针。Open 创建了 File 类型的值,并返回指向这个值的指针。「如果一个创建用的工厂函数返回了一个指针,就表示这个被返回的值的本质是非原始的。」

即便函数或者方法没有直接改变非原始的值的状态,依旧应该使用共享的方式传递.

即使没有修改接收者的值,依然是用指针接收者来声明的。因为 File 类型的值具备非原始的本质,所以总是应该被共享,而不是被复制。

「是使用值接收者还是指针接收者,不应该由该方法是否修改了接收到的值来决定。这个决策应该基于该类型的本质。」

这条规则的一个例外是,需要让类型值符合某个接口的时候,即便类型的本质是非原始本质的,也可以选择使用值接收者声明方法。这样做完全符合接口值调用方法的机制。

这部分还是有些不太明白,之后有时间还需要在看看。

0 人点赞