Go语言学习06-字符串

简述

Go语言中的字符串以原生数据类型出现,使用字符串就像使用其他原生数据类型(int、bool、float32、float64 等)一样。 Go 语言里的字符串的内部实现使用UTF-8编码。 字符串的值为双引号(")中的内容,可以在Go语言的源码中直接添加非ASCII码字符,例如:

s1 := "hello"
s2 := "你好"	//字符串
c1 := 'h'	//字符,一个字符=一个字节Byte=8bit(8个二进制位)
c2 := 'H'	
c3 := '好'	//一个utf-8编码的汉字'好'=一般占3个字节

Go语言中字符串只能用双引号包裹!Go语言中单引号包裹的是字符!

字符串是各种字符组合组成的,字符就是一个字母或者一个中文字等。

字符串转义符号

Go 语言的字符串常见转义符包含回车、换行、单双引号、制表符等,如下表所示。

注意,在双引号中的字符串,如果想要输出带有单引号,这时的单引号无需转义。

转义符 含义
\r 回车符(返回行首)
\n 换行符(直接跳到下一行的同列位置)
\t 制表符
\' 单引号
\" 双引号
\\ 反斜杠

image-20220210164323099

举个例子,我们要打印一个Windows平台下的一个文件路径:

package main
import (
    "fmt"
)
func main() {
    fmt.Println("str := \"c:\\Code\\lesson1\\go.exe\"")
}

多行字符串

Go语言中要定义一个多行字符串时,就必须使用反引号字符:

s1 := `第一行
第二行
第三行
`
fmt.Println(s1)

反引号间换行将被作为字符串中的换行,但是所有的转义字符均无效,文本将会原样输出。

字符串的常用操作

方法 介绍
len(str) 字节长度
+或fmt.Sprintf 拼接字符串
strings.Split 分割
strings.contains 判断是否包含
strings.HasPrefix,strings.HasSuffix 前缀/后缀判断
strings.Index(),strings.LastIndex() 子串出现的位置
strings.Join(a[]string, sep string) join操作

练习

package main

import (
	"fmt"
	"strings"
)

func main() {
	// \ 本来是具有特殊含义的,我应该告诉程序我写的\就是一个单纯的\
	path := "E:\\精进\\Go语言学习\\01-50"
	fmt.Println(path)
	//fmt.Println("\"E:\\精进\\Go语言学习\\01-50\"")
	s := "I'm ok!"
	fmt.Println(s)

	//多行字符串使用反引号来标识
	s2 := `			
	世情薄
		人情恶
			雨送黄昏花易落
	`
	fmt.Println(s2)
	s3 := `你好,我是人类高质量男性!`
	fmt.Println(len(s3)) //打印字符串长度,即字节长度,13*3=39

	//字符串拼接
	name := "理想"
	word := "大帅比"
	ss := name + word + "1"
	//用ss1来接收name+word这两个变量
	ss1 := fmt.Sprintf("%s%s+2", name, word)
	fmt.Println(ss)
	fmt.Println(ss1)
	// 分隔,就是path中,去掉\后的结果,类似于一个列表和数组
	ret := strings.Split(path, "\\")
	fmt.Println(ret)
	//ss中是否包含字符串"理想"
	fmt.Println(strings.Contains(ss, "理性"))
	//前缀,即判断是不是理想开头的
	fmt.Println(strings.HasPrefix(ss, "理想"))
	//后缀,即判断是不是理想结尾的
	fmt.Println(strings.HasSuffix(ss, "理想"))
	s4 := "abcdeb"
	//c在字符串出现的位置
	fmt.Println(strings.Index(s4, "c"))
	//a在字符串最后出现的位置
	fmt.Println(strings.LastIndex(s4, "a"))
	//拼接,这里必须是ret,不能是别的变量名
	//这里涉及到了切片,以后再细说哦
	fmt.Println(strings.Join(ret, "+"))
}

字符串的修改与转换

package main

import "fmt"

func main() {

	s := "123456"
	//n := len(s)
	//fmt.Println(n)

	// for i := 0; i < len(s); i++ {
	// 	fmt.Println(s[i])	//这样打印出来的效果就是ascii码,想要原样输出,就必须要有%c的存在
	// 	fmt.Printf("%c\n", s[i]) //%c:字符
	// }
	for _, c := range s { //这里同理,从字符串中拿出具体的字符,就需要%c
		fmt.Printf("%c\n", c)
	}

}

image-20220208211442989

byte和rune类型

组成每个字符串的元素叫做“字符”,可以通过遍历或者单个获取字符串元素获得字符。 字符用单引号(’)包裹起来,如:

var a = '中'
var b = 'x'

Go 语言的字符有以下两种:

  1. uint8类型,或者叫 byte 型,代表了ASCII码的一个字符。
  2. rune类型,代表一个 UTF-8字符

当需要处理中文、日文或者其他复合字符时,则需要用到rune类型。rune类型实际是一个int32

Go 使用了特殊的 rune 类型来处理 Unicode,让基于 Unicode 的文本处理更为方便,也可以使用 byte 型进行默认字符串处理,性能和扩展性都有照顾。

// 遍历字符串
func traversalString() {
	s := "hello沙河"
	for i := 0; i < len(s); i++ { //byte
		fmt.Printf("%v(%c) ", s[i], s[i])
	}
	fmt.Println()
	for _, r := range s { //rune
		fmt.Printf("%v(%c) ", r, r)
	}
	fmt.Println()
}

输出:

104(h) 101(e) 108(l) 108(l) 111(o) 230(æ) 178(²) 153() 230(æ) 178(²) 179(³) 
104(h) 101(e) 108(l) 108(l) 111(o) 27801(沙) 27827(河) 

因为UTF8编码下一个中文汉字由3~4个字节组成,所以我们不能简单的按照字节去遍历一个包含中文的字符串,否则就会出现上面输出中第一行的结果。

字符串底层是一个byte数组,所以可以和[]byte类型相互转换。字符串是不能修改的 字符串是由byte字节组成,所以字符串的长度是byte字节的长度。 rune类型用来表示utf8字符,一个rune字符由一个或多个byte组成。

修改字符串

首先要知道,字符串无法直接修改,需要修改字符串,需要先将其转换成[]rune[]byte,完成后再转换为string。无论哪种转换,都会重新分配内存,并复制字节数组。

func changeString() {
	s1 := "big"
	// 强制类型转换
	byteS1 := []byte(s1)
	byteS1[0] = 'p'
	fmt.Println(string(byteS1))

	s2 := "白萝卜"
	runeS2 := []rune(s2)	//把字符串强制转换成了一个rune
	runeS2[0] = '红'
	fmt.Println(string(runeS2))
}

类型转换(了解)

Go语言中只有强制类型转换,没有隐式类型转换。该语法只能在两个类型之间支持相互转换的时候使用。能够互相转的才能这么转。像布尔类型就无法转换。

强制类型转换的基本语法如下:

T(表达式)

其中,T表示要转换的类型。表达式包括变量、复杂算子和函数返回值等.

比如计算直角三角形的斜边长时使用math包的Sqrt()函数,该函数接收的是float64类型的参数,而变量a和b都是int类型的,这个时候就需要将a和b强制类型转换为float64类型。

func sqrtDemo() {
	var a, b = 3, 4
	var c int
	// math.Sqrt()接收的参数是float64类型,需要强制转换
	c = int(math.Sqrt(float64(a*a + b*b)))
	fmt.Println(c)
posted @ 2022-02-20 15:05  谨言慎行啊  阅读(203)  评论(0)    收藏  举报