字符型

字符串中的每一个元素叫做“字符”,在遍历或者单个获取字符串元素时可以获得字符。

go语言中没有字符型,推荐使用byte或rune,仅包含ASCII码时,使用byte,其余使用rune。

Go语言的字符有以下两种:

  • 一种是 uint8 类型,或者叫 byte 型,代表了 ASCII 码的一个字符。
  • 另一种是 rune 类型,代表一个 UTF-8 字符,当需要处理中文、日文或者其他复合字符时,则需要用到 rune 类型。rune 类型等价于 int32 类型。

字母一个字节,汉字3个字节

存储过程:字符—>码值(数字)—>二进制—>保存

直接输出为数字,按字符使用 %c

a := 'a'
fmt.Printf("a的类型%T,a的值:%v,a对应的字符:%c,a的大小:%d\n",a,a,a,unsafe.Sizeof(a))
you := '你'
fmt.Printf("you的类型%T,you的值:%v,you对应的字符:%c,you的大小:%d\n",you,you,you,unsafe.Sizeof(you))

字符串型

src\builtin\builtin.go

// string is the set of all strings of 8-bit bytes, conventionally but not
// necessarily representing UTF-8-encoded text. A string may be empty, but
// not nil. Values of string type are immutable.
type string string

由byte组成,是byte数组,不可以变,直接输出可以

str1 := "hello"
str2 := "你好"
fmt.Println("str1 str2:",str1,str2)

内存

src\reflect\value.go

// StringHeader is the runtime representation of a string.
// It cannot be used safely or portably and its representation may
// change in a later release.
// Moreover, the Data field is not sufficient to guarantee the data
// it references will not be garbage collected, so programs must keep
// a separate, correctly typed pointer to the underlying data.
type StringHeader struct {
	Data uintptr
	Len  int
}

目前,在go 1.16.3中是使用指针和长度的结构体表示,以后可能会修改。

world := "world"
world1 := "世界"
fmt.Printf("world:%v world1:%v world:%T,world1:%T\n", world,world1,world,world1)
fmt.Println("&world[0] &world1 len(world) len(world1):",&world,&world1,len(world),len(world1))
// &world[0] 不允许取地址

你可以访问world[0],但是不能访问world[0]的地址 &world[0],出于安全考虑。

原始字符串

双引号"识别转义字符,反引号`原生形式输出

str3 := "我要换行\n换好啦:)\n"
str4 := `我想换行\n换不了:(\n`

返回子串

类似Python的切片,没有步长,左闭右开,左右相等时为空,左默认为0,右默认为字符串长度

fmt.Println("world[:3] world1[3:]:",world[:3],world1[3:])

拼接

使用+,放不下时,+保留在上一行

str5 := str1+world+
	str2+world1

修改

使用切片

tmp := []byte(world)
tmp[0] = 'W'
world = string(tmp)
fmt.Println("world &world",world,&world)

注意:地址相同,确实是修改了

遍历

for或for range

for i:=0;i<len(world1);i=i+3{
	fmt.Print(world1[i:i+3])
}
for _,s := range world1{
	fmt.Printf("%c",s)
}

注意:中文是3个取一次,否则没意义。推荐使用for range方式,有字符和中文时都可以。

字节数组与字符串相互转换

string 不能直接和byte数组转换
string可以和byte的切片转换

string 转为[]byte

var str string = "test"
var data []byte = []byte(str)

byte[]转为string

var data [10]byte 
byte[0] = 'T'
byte[1] = 'E'
var str string = string(data[:])

strings包

比较

==

注意:严格区分大小写

EqualFold

func EqualFold(s, t string) bool

判断两个utf-8编码字符串(将unicode大写、小写、标题三种格式字符视为相同)是否相同。

strings.EqualFold(s,t string)bool

alpha := "abc"
alpha2 := "Abc"
fmt.Println("alpha==alpha2 strings.EqualFold(alpha,alpha2):", alpha==alpha2,strings.EqualFold(alpha,alpha2))

大小写转换

ToLower

func ToLower(s string) string

返回将所有字母都转为对应的小写版本的拷贝。

ToUpper

func ToUpper(s string) string

返回将所有字母都转为对应的大写版本的拷贝。

fmt.Println("",strings.ToUpper(alpha),strings.ToLower(alpha2))

去前后缀

TrimSpace

func TrimSpace(s string) string

返回将s前后端所有空白(unicode.IsSpace指定)都去掉的字符串。

Trim

func Trim(s string, cutset string) string

返回将s前后端所有cutset包含的utf-8码值都去掉的字符串。

TrimLeft

func TrimLeft(s string, cutset string) string

返回将s前端所有cutset包含的utf-8码值都去掉的字符串。

TrimRight

func TrimRight(s string, cutset string) string

返回将s后端所有cutset包含的utf-8码值都去掉的字符串。

song := "  \n\t两只\t老虎\t爱跳舞\n   "
fmt.Println("去空格 去空格和两只 去空格和两 去空格和跳舞:",strings.TrimSpace(song),strings.Trim(song," \n\t两只"),
	strings.TrimLeft(song," \n\t两"),strings.TrimRight(song," \n两跳舞"))

注意:TrimSpace将\t等也算为Space,指定时是字符集,在其中就算,直到左/右侧不在集合中停止。

判断前后缀

HasPrefix

func HasPrefix(s, prefix string) bool

判断s是否有前缀字符串prefix。

HasSuffix

func HasSuffix(s, suffix string) bool

判断s是否有后缀字符串suffix。

fmt.Println("song[4:]有两只前缀吗? song有爱跳舞后缀吗?",strings.HasPrefix(song[4:],"两只"),strings.HasSuffix(song,"爱跳舞"))

拆分与拼接

Split

func Split(s, sep string) []string

用去掉s中出现的sep的方式进行分割,会分割到结尾,并返回生成的所有片段组成的切片(每一个sep都会进行一次切割,即使两个sep相邻,也会进行两次切割)。如果sep为空字符,Split会将s切分成每一个unicode码值一个字符串。

Join

func Join(a []string, sep string) string

将一系列字符串连接为一个字符串,之间用sep来分隔。

ip := "192.168.31.129"
slice  := strings.Split(ip,".")
newIp := strings.Join(slice,"?")

子串

包含

Contains

func Contains(s, substr string) bool

判断字符串s是否包含子串substr。

fmt.Println("song包含老虎吗? ",strings.Contains(song,"老虎"))

统计

Count

func Count(s, sep string) int

返回字符串s中有几个不重复的sep子串。

fmt.Println("ip中有几个.? ",strings.Count(ip,"."))

查找

Index

func Index(s, sep string) int

子串sep在字符串s中第一次出现的位置,不存在则返回-1。

LastIndex

func LastIndex(s, sep string) int

子串sep在字符串s中最后一次出现的位置,不存在则返回-1。

fmt.Println("ip中第一个1的下标 ip中最后一个1的下标:",strings.Index(ip,"1"),strings.LastIndex(ip,"1"))

替换

Replace

func Replace(s, old, new string, n int) string

返回将s中前n个不重叠old子串都替换为new的新字符串,如果n<0会替换所有old子串。

fmt.Println("将ip中的.替换为*",strings.Replace(ip,".","*",-1))

类型转换函数Atoi等在数据转换文章,更多方法,查看参考的包

bytes包和strings包的函数差不多,只不过参数由string变为了[]byte,可以看下参考的Go标准库,这里就不展示了。

查看源代码也经常能看到官方的骚操作,比如bytes.Equal

func Equal(a, b []byte) bool {
	return string(a) == string(b)
}

unicode包

此包主要针对字符rune类型

是否是十进制数字

IsDigit

func IsDigit(r rune) bool

IsDigit报告一个字符是否是十进制数字字符。

ok := unicode.IsDigit(rune(ip[0]))
fmt.Printf("%c是十进制数字? %t\n",ip[0],ok)

是否是数字字符

IsNumber

func IsNumber(r rune) bool

IsNumber报告一个字符是否是数字字符

ok = unicode.IsNumber(rune(ip[0]))
fmt.Printf("%c是数字字符? %t\n",ip[0],ok)

是否是字母

IsLetter

func IsLetter(r rune) bool

IsLetter报告一个字符是否是字母

ok = unicode.IsLetter(rune(alpha[0]))
fmt.Printf("%c是字母? %t\n",alpha[0],ok)

是否是小写字母

IsLower

func IsLower(r rune) bool

返回字符是否是小写字母

ok = unicode.IsLower(rune(ip[0]))
fmt.Printf("%c是小写字母? %t\n",ip[0],ok)

是否是大写字母

IsUpper

func IsUpper(r rune) bool

返回字符是否是大写字母。

ok = unicode.IsUpper(rune(alpha2[0]))
fmt.Printf("%c是大写字母? %t\n",alpha2[0],ok)

返回对应的大写字母

ToUpper

func ToUpper(r rune) rune

返回对应的大写字母,不是字母是返回原字符。

fmt.Printf("%c转换为大写字母是%c\n",ip[0],unicode.ToUpper(rune(ip[0])),)

返回对应的小写字母

ToLower

func ToLower(r rune) rune

返回对应的小写字母,不是字母是返回原字符。

fmt.Printf("%c转换为小写字母是%c\n",alpha2[0],unicode.ToLower(rune(alpha2[0])))