当前位置 博文首页 > 简单聊一聊Go语言中的数组和切片

    简单聊一聊Go语言中的数组和切片

    作者:架构精进之路 时间:2021-08-03 17:59

    目录
    • 1. 数组
    • 2. 切片(Slice)
      • append 函数
    • 总结

      1. 数组

      数组是一个由固定长度的特定类型元素组成的序列,一个数组可以由零个或多个元素组成。因为数组的长度是固定的,因此在 Go 语言中很少直接使用数组。和数组对应的类型是 Slice(切片),它是可以增长和收缩的动态序列,slice 功能也更灵活。

      数组的每个元素可以通过索引下标来访问,索引下标的范围是从 0 开始到数组长度减 1 的位置。内置的 len 函数将返回数组中元素的个数。

      var a [3]int             // array of 3 integers
      fmt.Println(a[0])        // print the first element
      fmt.Println(a[len(a)-1]) // print the last element, a[2]
      

      默认情况下,数组的每个元素都被初始化为元素类型对应的零值,对于数字类型来说就是 0。

      var q [3]int = [3]int{1, 2, 3}
      var r [3]int = [3]int{1, 2}
      fmt.Println(r[2]) // "0"
      
      

      如果在数组的长度位置出现的是“...”省略号,则表示数组的长度是根据初始化值的个数来计算。因此,上面 q 数组的定义可以简化为:

      q := [...]int{1, 2, 3}
      fmt.Printf("%T\n", q) // "[3]int"
      

      数组的长度是数组类型的一个组成部分,因此[3]int 和[4]int 是两种不同的数组类型。

      数组的长度必须是常量表达式,因为数组的长度需要在编译阶段确定。

      q := [3]int{1, 2, 3}
      q = [4]int{1, 2, 3, 4} // compile error: cannot assign [4]int to [3]int
      

      如果一个数组的元素类型是可以相互比较的,那么数组类型也是可以相互比较的,这时候我们可以直接通过==比较运算符来比较两个数组,只有当两个数组的所有元素都是相等的时候数组才是相等的。不相等比较运算符!=遵循同样的规则。

      a := [2]int{1, 2}
      b := [...]int{1, 2}
      c := [2]int{1, 3}
      fmt.Println(a == b, a == c, b == c) // "true false false"
      d := [3]int{1, 2}
      fmt.Println(a == d) // compile error: cannot compare [2]int == [3]int

      2. 切片(Slice)

      Slice(切片)代表变长的序列,序列中每个元素都有相同的类型。一个 slice 类型一般写作[]T,其中 T 代表 slice 中元素的类型;slice 的语法和数组很像,只是没有固定长度而已。

      一个 slice 是一个轻量级的数据结构,提供了访问数组子序列(或者全部)元素的功能,而且 slice 的底层确实引用一个数组对象。

      一个 slice 由三个部分构成:指针、长度和容量。

      • 指针指向第一个 slice 元素对应的底层数组元素的地址,要注意的是 slice 的第一个元素并不一定就是数组的第一个元素。
      • 长度对应 slice 中元素的数目;
      • 长度不能超过容量,容量一般是从 slice 的开始位置到底层数据的结尾位置。内置的 len 和 cap 函数分别返回 slice 的长度和容量。

      表示一年中每个月份名字的字符串数组,还有重叠引用了该数组的两个 slice。数组这样定义:

      months := [...]string{1: "January", /* ... */, 12: "December"}
      

      因此一月份是 months[1],十二月份是 months[12]。

      通常,数组的第一个元素从索引 0 开始,但是月份一般是从 1 开始的,因此我们声明数组时直接跳过第 0 个元素,第 0 个元素会被自动初始化为空字符串。

      slice 的切片操作 s[i:j],其中 0 ≤ i≤ j≤ cap(s),用于创建一个新的 slice,引用 s 的从第 i 个元素开始到第 j-1 个元素的子序列。新的 slice 将只有 j-i 个元素。如果 i 位置的索引被省略的话将使用 0 代替,如果 j 位置的索引被省略的话将使用 len(s)代替。因此,months[1:13]切片操作将引用全部有效的月份,和 months[1:]操作等价;months[:]切片操作则是引用整个数组。让我们分别定义表示第二季度和北方夏天月份的 slice,它们有重叠部分:

      Q2 := months[4:7]
      summer := months[6:9]
      fmt.Println(Q2)     // ["April" "May" "June"]
      fmt.Println(summer) // ["June" "July" "August"]
      

      两个 slice 都包含了六月份。

      append 函数

      append 函数用于向 slice 追加元素:

      var runes []rune
      for _, r := range "Hello, 世界" {
          runes = append(runes, r)
      }
      fmt.Printf("%q\n", runes) // "['H' 'e' 'l' 'l' 'o' ',' ' ' '世' '界']"
      

      为了提高内存使用效率,新分配的数组一般略大于保存 x 和 y 所需要的最低大小。通过在每次扩展数组时直接将长度翻倍从而避免了多次内存分配,也确保了添加单个元素操作的平均时间是一个常数时间。这个程序演示了效果:

      func main() {
          var x, y []int
          for i := 0; i < 10; i++ {
              y = appendInt(x, i)
              fmt.Printf("%d cap=%d\t%v\n", i, cap(y), y)
              x = y
          }
      }
      
      //每一次容量的变化都会导致重新分配内存和copy操作:
      0  cap=1    [0]
      1  cap=2    [0 1]
      2  cap=4    [0 1 2]
      3  cap=4    [0 1 2 3]
      4  cap=8    [0 1 2 3 4]
      5  cap=8    [0 1 2 3 4 5]
      6  cap=8    [0 1 2 3 4 5 6]
      7  cap=8    [0 1 2 3 4 5 6 7]
      8  cap=16   [0 1 2 3 4 5 6 7 8]
      9  cap=16   [0 1 2 3 4 5 6 7 8 9]
      
      

      让我们仔细查看 i=3 次的迭代。当时 x 包含了[0 1 2]三个元素,但是容量是 4,因此可以简单将新的元素添加到末尾,不需要新的内存分配。然后新的 y 的长度和容量都是 4,并且和 x 引用着相同的底层数组,如图 4.2 所示。

      在下一次迭代时 i=4,现在没有新的空余的空间了,因此 appendInt 函数分配一个容量为 8 的底层数组,将 x 的 4 个元素[0 1 2 3]复制到新空间的开头,然后添加新的元素 i,新元素的值是 4。新的 y 的长度是 5,容量是 8;后面有 3 个空闲的位置,三次迭代都不需要分配新的空间。当前迭代中,y 和 x 是对应不同底层数组的 view。这次操作如图 4.3 所示。

      内置的 append 函数可能使用比 appendInt 更复杂的内存扩展策略。

      因此,通常我们并不知道 append 调用是否导致了内存的重新分配,因此我们也不能确认新的 slice 和原始的 slice 是否引用的是相同的底层数组空间。

      同样,我们不能确认在原先的 slice 上的操作是否会影响到新的 slice。

      总结

      jsjbwy
      下一篇:没有了