Go语言学习06-字符串

简述

Go语言中的字符串以原生数据类型出现，使用字符串就像使用其他原生数据类型（int、bool、float32、float64 等）一样。 Go 语言里的字符串的内部实现使用UTF-8编码。字符串的值为双引号(")中的内容，可以在Go语言的源码中直接添加非ASCII码字符，例如：

s1 := "hello"
s2 := "你好"	//字符串
c1 := 'h'	//字符，一个字符=一个字节Byte=8bit(8个二进制位)
c2 := 'H'	
c3 := '好'	//一个utf-8编码的汉字'好'=一般占3个字节

Go语言中字符串只能用双引号包裹！Go语言中单引号包裹的是字符！

字符串是各种字符组合组成的，字符就是一个字母或者一个中文字等。

字符串转义符号

Go 语言的字符串常见转义符包含回车、换行、单双引号、制表符等，如下表所示。

注意，在双引号中的字符串，如果想要输出带有单引号，这时的单引号无需转义。

转义符	含义
`\r`	回车符（返回行首）
`\n`	换行符（直接跳到下一行的同列位置）
`\t`	制表符
`\'`	单引号
`\"`	双引号
`\\`	反斜杠

举个例子，我们要打印一个Windows平台下的一个文件路径：

package main
import (
    "fmt"
)
func main() {
    fmt.Println("str := \"c:\\Code\\lesson1\\go.exe\"")
}

多行字符串

Go语言中要定义一个多行字符串时，就必须使用反引号字符：

s1 := `第一行
第二行
第三行
`
fmt.Println(s1)

反引号间换行将被作为字符串中的换行，但是所有的转义字符均无效，文本将会原样输出。

字符串的常用操作

方法	介绍
len(str)	求字节长度
+或fmt.Sprintf	拼接字符串
strings.Split	分割
strings.contains	判断是否包含
strings.HasPrefix,strings.HasSuffix	前缀/后缀判断
strings.Index(),strings.LastIndex()	子串出现的位置
strings.Join(a[]string, sep string)	join操作

练习

package main

import (
	"fmt"
	"strings"
)

func main() {
	// \ 本来是具有特殊含义的，我应该告诉程序我写的\就是一个单纯的\
	path := "E:\\精进\\Go语言学习\\01-50"
	fmt.Println(path)
	//fmt.Println("\"E:\\精进\\Go语言学习\\01-50\"")
	s := "I'm ok!"
	fmt.Println(s)

	//多行字符串使用反引号来标识
	s2 := `			
	世情薄
		人情恶
			雨送黄昏花易落
	`
	fmt.Println(s2)
	s3 := `你好，我是人类高质量男性！`
	fmt.Println(len(s3)) //打印字符串长度，即字节长度，13*3=39

	//字符串拼接
	name := "理想"
	word := "大帅比"
	ss := name + word + "1"
	//用ss1来接收name+word这两个变量
	ss1 := fmt.Sprintf("%s%s+2", name, word)
	fmt.Println(ss)
	fmt.Println(ss1)
	// 分隔，就是path中，去掉\后的结果，类似于一个列表和数组
	ret := strings.Split(path, "\\")
	fmt.Println(ret)
	//ss中是否包含字符串"理想"
	fmt.Println(strings.Contains(ss, "理性"))
	//前缀，即判断是不是理想开头的
	fmt.Println(strings.HasPrefix(ss, "理想"))
	//后缀，即判断是不是理想结尾的
	fmt.Println(strings.HasSuffix(ss, "理想"))
	s4 := "abcdeb"
	//c在字符串出现的位置
	fmt.Println(strings.Index(s4, "c"))
	//a在字符串最后出现的位置
	fmt.Println(strings.LastIndex(s4, "a"))
	//拼接，这里必须是ret，不能是别的变量名
	//这里涉及到了切片，以后再细说哦
	fmt.Println(strings.Join(ret, "+"))
}

字符串的修改与转换

package main

import "fmt"

func main() {

	s := "123456"
	//n := len(s)
	//fmt.Println(n)

	// for i := 0; i < len(s); i++ {
	// 	fmt.Println(s[i])	//这样打印出来的效果就是ascii码，想要原样输出，就必须要有%c的存在
	// 	fmt.Printf("%c\n", s[i]) //%c:字符
	// }
	for _, c := range s { //这里同理，从字符串中拿出具体的字符，就需要%c
		fmt.Printf("%c\n", c)
	}

}

byte和rune类型

组成每个字符串的元素叫做“字符”，可以通过遍历或者单个获取字符串元素获得字符。字符用单引号（’）包裹起来，如：

var a = '中'
var b = 'x'

Go 语言的字符有以下两种：

uint8类型，或者叫 byte 型，代表了ASCII码的一个字符。
rune类型，代表一个 UTF-8字符。

当需要处理中文、日文或者其他复合字符时，则需要用到rune类型。rune类型实际是一个int32。

Go 使用了特殊的 rune 类型来处理 Unicode，让基于 Unicode 的文本处理更为方便，也可以使用 byte 型进行默认字符串处理，性能和扩展性都有照顾。

// 遍历字符串
func traversalString() {
	s := "hello沙河"
	for i := 0; i < len(s); i++ { //byte
		fmt.Printf("%v(%c) ", s[i], s[i])
	}
	fmt.Println()
	for _, r := range s { //rune
		fmt.Printf("%v(%c) ", r, r)
	}
	fmt.Println()
}

输出：

104(h) 101(e) 108(l) 108(l) 111(o) 230(æ) 178(²) 153() 230(æ) 178(²) 179(³) 
104(h) 101(e) 108(l) 108(l) 111(o) 27801(沙) 27827(河)

因为UTF8编码下一个中文汉字由3~4个字节组成，所以我们不能简单的按照字节去遍历一个包含中文的字符串，否则就会出现上面输出中第一行的结果。

字符串底层是一个byte数组，所以可以和[]byte类型相互转换。字符串是不能修改的字符串是由byte字节组成，所以字符串的长度是byte字节的长度。 rune类型用来表示utf8字符，一个rune字符由一个或多个byte组成。

修改字符串

首先要知道，字符串无法直接修改，需要修改字符串，需要先将其转换成[]rune或[]byte，完成后再转换为string。无论哪种转换，都会重新分配内存，并复制字节数组。

func changeString() {
	s1 := "big"
	// 强制类型转换
	byteS1 := []byte(s1)
	byteS1[0] = 'p'
	fmt.Println(string(byteS1))

	s2 := "白萝卜"
	runeS2 := []rune(s2)	//把字符串强制转换成了一个rune
	runeS2[0] = '红'
	fmt.Println(string(runeS2))
}

类型转换（了解）

Go语言中只有强制类型转换，没有隐式类型转换。该语法只能在两个类型之间支持相互转换的时候使用。能够互相转的才能这么转。像布尔类型就无法转换。

强制类型转换的基本语法如下：

T(表达式)

其中，T表示要转换的类型。表达式包括变量、复杂算子和函数返回值等.

比如计算直角三角形的斜边长时使用math包的Sqrt()函数，该函数接收的是float64类型的参数，而变量a和b都是int类型的，这个时候就需要将a和b强制类型转换为float64类型。

func sqrtDemo() {
	var a, b = 3, 4
	var c int
	// math.Sqrt()接收的参数是float64类型，需要强制转换
	c = int(math.Sqrt(float64(a*a + b*b)))
	fmt.Println(c)

posted @ 2022-02-20 15:05 谨言慎行啊阅读(203) 评论(0) 收藏举报

刷新页面返回顶部

薄云

谨言慎行！