go字符和字符串
字符型
字符串中的每一个元素叫做“字符”,在遍历或者单个获取字符串元素时可以获得字符。
go语言中没有字符型,推荐使用byte或rune,仅包含ASCII码时,使用byte,其余使用rune。
Go语言的字符有以下两种:
- 一种是 uint8 类型,或者叫 byte 型,代表了 ASCII 码的一个字符。
- 另一种是 rune 类型,代表一个 UTF-8 字符,当需要处理中文、日文或者其他复合字符时,则需要用到 rune 类型。rune 类型等价于 int32 类型。
字母一个字节,汉字3个字节
存储过程:字符—>码值(数字)—>二进制—>保存
直接输出为数字,按字符使用 %c
a := 'a'
fmt.Printf("a的类型%T,a的值:%v,a对应的字符:%c,a的大小:%d\n",a,a,a,unsafe.Sizeof(a))
you := '你'
fmt.Printf("you的类型%T,you的值:%v,you对应的字符:%c,you的大小:%d\n",you,you,you,unsafe.Sizeof(you))
字符串型
src\builtin\builtin.go
// string is the set of all strings of 8-bit bytes, conventionally but not
// necessarily representing UTF-8-encoded text. A string may be empty, but
// not nil. Values of string type are immutable.
type string string
由byte组成,是byte数组,不可以变,直接输出可以
str1 := "hello"
str2 := "你好"
fmt.Println("str1 str2:",str1,str2)
内存
src\reflect\value.go
// StringHeader is the runtime representation of a string.
// It cannot be used safely or portably and its representation may
// change in a later release.
// Moreover, the Data field is not sufficient to guarantee the data
// it references will not be garbage collected, so programs must keep
// a separate, correctly typed pointer to the underlying data.
type StringHeader struct {
Data uintptr
Len int
}
目前,在go 1.16.3中是使用指针和长度的结构体表示,以后可能会修改。
world := "world"
world1 := "世界"
fmt.Printf("world:%v world1:%v world:%T,world1:%T\n", world,world1,world,world1)
fmt.Println("&world[0] &world1 len(world) len(world1):",&world,&world1,len(world),len(world1))
// &world[0] 不允许取地址
你可以访问world[0],但是不能访问world[0]的地址 &world[0],出于安全考虑。
原始字符串
双引号"识别转义字符,反引号`原生形式输出
str3 := "我要换行\n换好啦:)\n"
str4 := `我想换行\n换不了:(\n`
返回子串
类似Python的切片,没有步长,左闭右开,左右相等时为空,左默认为0,右默认为字符串长度
fmt.Println("world[:3] world1[3:]:",world[:3],world1[3:])
拼接
使用+,放不下时,+保留在上一行
str5 := str1+world+
str2+world1
修改
使用切片
tmp := []byte(world)
tmp[0] = 'W'
world = string(tmp)
fmt.Println("world &world",world,&world)
注意:地址相同,确实是修改了
遍历
for或for range
for i:=0;i<len(world1);i=i+3{
fmt.Print(world1[i:i+3])
}
for _,s := range world1{
fmt.Printf("%c",s)
}
注意:中文是3个取一次,否则没意义。推荐使用for range方式,有字符和中文时都可以。
字节数组与字符串相互转换
string 不能直接和byte数组转换
string可以和byte的切片转换
string 转为[]byte
var str string = "test"
var data []byte = []byte(str)
byte[]转为string
var data [10]byte
byte[0] = 'T'
byte[1] = 'E'
var str string = string(data[:])
strings包
比较
==
注意:严格区分大小写
EqualFold
func EqualFold(s, t string) bool
判断两个utf-8编码字符串(将unicode大写、小写、标题三种格式字符视为相同)是否相同。
strings.EqualFold(s,t string)bool
alpha := "abc"
alpha2 := "Abc"
fmt.Println("alpha==alpha2 strings.EqualFold(alpha,alpha2):", alpha==alpha2,strings.EqualFold(alpha,alpha2))
大小写转换
ToLower
func ToLower(s string) string
返回将所有字母都转为对应的小写版本的拷贝。
ToUpper
func ToUpper(s string) string
返回将所有字母都转为对应的大写版本的拷贝。
fmt.Println("",strings.ToUpper(alpha),strings.ToLower(alpha2))
去前后缀
TrimSpace
func TrimSpace(s string) string
返回将s前后端所有空白(unicode.IsSpace指定)都去掉的字符串。
Trim
func Trim(s string, cutset string) string
返回将s前后端所有cutset包含的utf-8码值都去掉的字符串。
TrimLeft
func TrimLeft(s string, cutset string) string
返回将s前端所有cutset包含的utf-8码值都去掉的字符串。
TrimRight
func TrimRight(s string, cutset string) string
返回将s后端所有cutset包含的utf-8码值都去掉的字符串。
song := " \n\t两只\t老虎\t爱跳舞\n "
fmt.Println("去空格 去空格和两只 去空格和两 去空格和跳舞:",strings.TrimSpace(song),strings.Trim(song," \n\t两只"),
strings.TrimLeft(song," \n\t两"),strings.TrimRight(song," \n两跳舞"))
注意:TrimSpace将\t等也算为Space,指定时是字符集,在其中就算,直到左/右侧不在集合中停止。
判断前后缀
HasPrefix
func HasPrefix(s, prefix string) bool
判断s是否有前缀字符串prefix。
HasSuffix
func HasSuffix(s, suffix string) bool
判断s是否有后缀字符串suffix。
fmt.Println("song[4:]有两只前缀吗? song有爱跳舞后缀吗?",strings.HasPrefix(song[4:],"两只"),strings.HasSuffix(song,"爱跳舞"))
拆分与拼接
Split
func Split(s, sep string) []string
用去掉s中出现的sep的方式进行分割,会分割到结尾,并返回生成的所有片段组成的切片(每一个sep都会进行一次切割,即使两个sep相邻,也会进行两次切割)。如果sep为空字符,Split会将s切分成每一个unicode码值一个字符串。
Join
func Join(a []string, sep string) string
将一系列字符串连接为一个字符串,之间用sep来分隔。
ip := "192.168.31.129"
slice := strings.Split(ip,".")
newIp := strings.Join(slice,"?")
子串
包含
Contains
func Contains(s, substr string) bool
判断字符串s是否包含子串substr。
fmt.Println("song包含老虎吗? ",strings.Contains(song,"老虎"))
统计
Count
func Count(s, sep string) int
返回字符串s中有几个不重复的sep子串。
fmt.Println("ip中有几个.? ",strings.Count(ip,"."))
查找
Index
func Index(s, sep string) int
子串sep在字符串s中第一次出现的位置,不存在则返回-1。
LastIndex
func LastIndex(s, sep string) int
子串sep在字符串s中最后一次出现的位置,不存在则返回-1。
fmt.Println("ip中第一个1的下标 ip中最后一个1的下标:",strings.Index(ip,"1"),strings.LastIndex(ip,"1"))
替换
Replace
func Replace(s, old, new string, n int) string
返回将s中前n个不重叠old子串都替换为new的新字符串,如果n<0会替换所有old子串。
fmt.Println("将ip中的.替换为*",strings.Replace(ip,".","*",-1))
类型转换函数Atoi等在数据转换文章,更多方法,查看参考的包
bytes包和strings包的函数差不多,只不过参数由string变为了[]byte,可以看下参考的Go标准库,这里就不展示了。
查看源代码也经常能看到官方的骚操作,比如bytes.Equal
func Equal(a, b []byte) bool {
return string(a) == string(b)
}
unicode包
此包主要针对字符rune类型
是否是十进制数字
IsDigit
func IsDigit(r rune) bool
IsDigit报告一个字符是否是十进制数字字符。
ok := unicode.IsDigit(rune(ip[0]))
fmt.Printf("%c是十进制数字? %t\n",ip[0],ok)
是否是数字字符
IsNumber
func IsNumber(r rune) bool
IsNumber报告一个字符是否是数字字符
ok = unicode.IsNumber(rune(ip[0]))
fmt.Printf("%c是数字字符? %t\n",ip[0],ok)
是否是字母
IsLetter
func IsLetter(r rune) bool
IsLetter报告一个字符是否是字母
ok = unicode.IsLetter(rune(alpha[0]))
fmt.Printf("%c是字母? %t\n",alpha[0],ok)
是否是小写字母
IsLower
func IsLower(r rune) bool
返回字符是否是小写字母
ok = unicode.IsLower(rune(ip[0]))
fmt.Printf("%c是小写字母? %t\n",ip[0],ok)
是否是大写字母
IsUpper
func IsUpper(r rune) bool
返回字符是否是大写字母。
ok = unicode.IsUpper(rune(alpha2[0]))
fmt.Printf("%c是大写字母? %t\n",alpha2[0],ok)
返回对应的大写字母
ToUpper
func ToUpper(r rune) rune
返回对应的大写字母,不是字母是返回原字符。
fmt.Printf("%c转换为大写字母是%c\n",ip[0],unicode.ToUpper(rune(ip[0])),)
返回对应的小写字母
ToLower
func ToLower(r rune) rune
返回对应的小写字母,不是字母是返回原字符。
fmt.Printf("%c转换为小写字母是%c\n",alpha2[0],unicode.ToLower(rune(alpha2[0])))
- 感谢你赐予我前进的力量