Go 字符串函数
最后修改时间 2024 年 4 月 11 日
在本文中,我们将介绍如何在 Golang 中使用字符串函数。
strings 包实现了处理 UTF-8 编码字符串的简单函数。
Go 字符串重复
repeat 函数返回一个新字符串,该字符串由指定次数的字符串副本组成。
package main
import (
"fmt"
"strings"
)
func main() {
w := "falcon"
fmt.Println(strings.Repeat(w+" ", 5))
}
我们将给定的字符串重复五次。
$ go run repeat_fun.go falcon falcon falcon falcon falcon
Go 字符串比较
Compare 函数按字典顺序比较两个字符串。要以不区分大小写的方式比较两个字符串,我们使用 EqualFold 函数。
package main
import (
"fmt"
"strings"
)
func main() {
w1 := "falcon"
w2 := "Falcon"
if strings.Compare(w1, w2) == 0 {
fmt.Println("The words are equal")
} else {
fmt.Println("The words are not equal")
}
if strings.EqualFold(w1, w2) {
fmt.Println("The words are equal")
} else {
fmt.Println("The words are not equal")
}
}
该示例比较了两个字符串。
$ go run comparing.go The words are not equal The words are equal
Go 字符串 Replace 和 ReplaceAll
Replace 函数返回一个字符串的副本,其中前 n 个字符串被替换,而 ReplaceAll 返回一个副本,其中所有字符串都被替换。
package main
import (
"fmt"
"strings"
)
func main() {
msg := "I saw a fox in the forest. The fox had brown fur."
output := strings.Replace(msg, "fox", "wolf", 2)
fmt.Println(output)
output2 := strings.ReplaceAll(msg, "fox", "wolf")
fmt.Println(output2)
}
示例将 fox 替换为 wolf。
$ go run replacing.go I saw a wolf in the forest. The wolf had brown fur. I saw a wolf in the forest. The wolf had brown fur.
Go 字符串索引
Index 函数返回找到的第一个子字符串的索引,而 LastIndex 查找最后一个索引。
package main
import (
"fmt"
"strings"
)
func main() {
msg := "I saw a fox in the forest. The fox had brown fur. I like foxes."
idx1 := strings.Index(msg, "fox")
fmt.Println(idx1)
idx2 := strings.LastIndex(msg, "fox")
fmt.Println(idx2)
}
我们查找单词“fox”的第一个和最后一个索引。
$ go run indexing.go 8 57
Go 字符串计数
Count 函数计算在字符串中找到的子字符串的数量。
package main
import (
"fmt"
"strings"
)
func main() {
word := "wood"
c1 := "o"
c2 := "w"
n1 := strings.Count(word, c1)
fmt.Printf("# of %s in %s: %d\n", c1, word, n1)
n2 := strings.Count(word, c2)
fmt.Printf("# of %s in %s: %d\n", c2, word, n2)
}
我们计算在“wood”中找到的字符 'o' 和 'w' 的次数。
$ go run counting.go # of o in wood: 2 # of w in wood: 1
Go 字符串 ToUpper, ToLower, Title
ToLower 函数返回字符串的小写副本,而 ToUpper 返回字符串的大写版本。Title 函数返回给定字符串的标题化副本(仅首字母大写)。
package main
import (
"fmt"
"strings"
)
func main() {
msg := "and old falcon"
msg2 := "čerešňa"
fmt.Println(strings.Title(msg))
fmt.Println(strings.ToUpper(msg))
fmt.Println(strings.ToUpper(msg2))
fmt.Println(strings.Title(msg2))
}
我们使用这些函数更改两个单词的大小写。
$ go run lower_upper.go And Old Falcon AND OLD FALCON ČEREŠŇA Čerešňa
Go 字符串 HasPrefix 和 HasSuffix
HasPrefix 函数检查字符串是否以给定的前缀开头。HasSufffix 函数检查字符串是否以给定的后缀结尾。
package main
import (
"fmt"
"strings"
)
func main() {
words := []string {"sky", "lot", "car", "wood", "cloud",
"cup", "war", "wind", "near", "tell", "cheer", "coin", "book"}
for _, word := range words {
if strings.HasPrefix(word, "c") {
fmt.Println(word)
}
}
fmt.Println("----------------------")
for _, word := range words {
if strings.HasSuffix(word, "r") {
fmt.Println(word)
}
}
}
我们有一个单词切片。我们遍历切片的元素,并打印所有以“c”开头并以“r”结尾的单词。
$ go run starts_ends.go car cloud cup cheer coin ---------------------- car war near cheer
Go 字符串 Contains 和 ContainsRune
Contains 函数检查给定的子字符串是否存在于字符串中。ConstainsRune 检查 Unicode 代码点是否在字符串中。
package main
import (
"fmt"
"strings"
)
func main() {
msg := "a blue 🐋"
r := '🐋'
if strings.ContainsRune(msg, r) {
fmt.Println("yes")
} else {
fmt.Println("no")
}
fmt.Println("-----------------")
if strings.Contains(msg, "🐋") {
fmt.Println("yes")
} else {
fmt.Println("no")
}
}
我们使用这两个方法来确定字符串中是否存在海豚符文。
$ go run contains.go yes ----------------- yes
Go 字符串修剪函数
Trim 返回字符串的一个切片,其中删除了 cutset 中包含的所有前导和尾随 Unicode 代码点。TrimLeft 函数返回字符串的一个切片,其中删除了 cutset 中包含的所有前导 Unicode 代码点。TrimRight 函数返回字符串的一个切片,其中删除了 cutset 中包含的所有尾随 Unicode 代码点。
package main
import (
"fmt"
"strings"
)
func main() {
msg := ".an old falcon!"
cutset := ".!"
msg2 := strings.Trim(msg, cutset)
fmt.Println(msg2)
msg3 := strings.TrimLeft(msg, cutset)
fmt.Println(msg3)
msg4 := strings.TrimRight(msg, cutset)
fmt.Println(msg4)
}
我们使用这三个函数从字符串中删除句点和感叹号。
$ go run trim_funs.go an old falcon an old falcon! .an old falcon
TrimSpace 函数删除所有前导和尾随的空格字符。TrimFunc 返回字符串的一个切片,其中删除了满足提供函数的所有前导和尾随 Unicode 代码点。
package main
import (
"fmt"
"strings"
"unicode"
)
func main() {
msg := "\t\tand old falcon\n"
msg2 := strings.TrimSpace(msg)
fmt.Println(msg2)
msg3 := strings.TrimFunc(msg, trimSpace)
fmt.Println(msg3)
}
func trimSpace(r rune) bool {
return !unicode.IsLetter(r)
}
在代码示例中,我们使用提到的函数删除了字符串的前导和尾随空格。
TrimPrefix 函数返回不带提供的领先前缀字符串的字符串,而 TrimSuffix 返回不带尾随后缀字符串的字符串。
package main
import (
"fmt"
"strings"
)
func main() {
msg := "--and old falcon--"
msg2 := strings.TrimPrefix(msg, "--")
fmt.Println(msg2)
msg3 := strings.TrimSuffix(msg, "--")
fmt.Println(msg3)
}
示例演示了如何从字符串的开头和结尾删除“--”字符。
$ go run trim_funs3.go and old falcon-- --and old falcon
Go 字符串 Split
Split 函数将切片分解为由给定分隔符分隔的所有子字符串,并返回分隔符之间的子字符串切片。
package main
import (
"fmt"
"log"
"strconv"
"strings"
)
func main() {
msg := "3,4,5,6,7,8,9,10,11"
data := strings.Split(msg, ",")
fmt.Printf("%v\n", data)
var sum = 0
for _, e := range data {
val, err := strconv.Atoi(e)
if err != nil {
log.Fatal(err)
}
sum += val
}
fmt.Println(sum)
}
我们有一个由逗号分隔的整数值字符串。该字符串按逗号分割成几部分。使用 strconv.Atoi 将字符串部分转换为整数,然后将整数相加。
$ go run split_fun.go [3 4 5 6 7 8 9 10 11] 63
Go 字符串 Join
Join 函数将切片参数的元素连接起来,创建一个单一的字符串。
package main
import (
"fmt"
"strings"
)
func main() {
words := []string{"an", "old", "falcon", "in", "the", "sky"}
msg := strings.Join(words, " ")
fmt.Println(msg)
}
我们用空格字符连接切片中的单词。
Go 字符串 Fields
Fields 函数按一个或多个空格字符将给定字符串分割成几部分。它提供了一种方便的方式将字符串分割成单词。
The Battle of Thermopylae was fought between an alliance of Greek city-states, led by King Leonidas of Sparta, and the Persian Empire of Xerxes I over the course of three days, during the second Persian invasion of Greece.
这是一个小的文本文件。
package main
import (
"fmt"
"io/ioutil"
"log"
"strings"
)
func main() {
fileName := "thermopylae.txt"
bs, err := ioutil.ReadFile(fileName)
if err != nil {
log.Fatal(err)
}
text := string(bs)
fields := strings.Fields(text)
for _, field := range fields {
fmt.Println(strings.Trim(field, ".,"))
}
}
我们将给定的文件读入一个字符串,并使用 Fields 将其分割成单词。我们还从单词中删除了句点和逗号字符。
$ go run fields_fun.go The Battle of Thermopylae was fought between an alliance of Greek city-states ...
Go 字符串 FieldsFun
FieldsFunc 函数在满足提供函数的每个 Unicode 代码点序列处分割字符串,并返回一个切片数组。
$ wget https://raw.githubusercontent.com/janbodnar/data/main/the-king-james-bible.txt
我们使用《英王钦定本圣经》。
package main
import (
"fmt"
"io/ioutil"
"log"
"sort"
"strings"
)
func main() {
fileName := "the-king-james-bible.txt"
bs, err := ioutil.ReadFile(fileName)
if err != nil {
log.Fatal(err)
}
text := string(bs)
fields := strings.FieldsFunc(text, func(r rune) bool {
return !('a' <= r && r <= 'z' || 'A' <= r && r <= 'Z' || r == '\'')
})
wordsCount := make(map[string]int)
for _, field := range fields {
wordsCount[field]++
}
keys := make([]string, 0, len(wordsCount))
for key := range wordsCount {
keys = append(keys, key)
}
sort.Slice(keys, func(i, j int) bool {
return wordsCount[keys[i]] > wordsCount[keys[j]]
})
for idx, key := range keys {
fmt.Printf("%s %d\n", key, wordsCount[key])
if idx == 10 {
break
}
}
}
我们统计《英王钦定本圣经》中单词的频率。
fields := strings.FieldsFunc(text, func(r rune) bool {
return !('a' <= r && r <= 'z' || 'A' <= r && r <= 'Z' || r == '\'')
})
FieldsFunc 按非字母字符和撇号分割文本。这也将忽略所有诗句编号。
wordsCount := make(map[string]int)
for _, field := range fields {
wordsCount[field]++
}
每个单词及其频率存储在 wordsCount 映射中。
keys := make([]string, 0, len(wordsCount))
for key := range wordsCount {
keys = append(keys, key)
}
sort.Slice(keys, func(i, j int) bool {
return wordsCount[keys[i]] > wordsCount[keys[j]]
})
为了按频率对单词进行排序,我们创建了一个新的 keys 切片。我们将所有单词放入其中,并按它们的频率值对它们进行排序。
for idx, key := range keys {
fmt.Printf("%s %d\n", key, wordsCount[key])
if idx == 10 {
break
}
}
我们打印圣经中出现频率最高的十个词。
$ go run word_freq.go the 62103 and 38848 of 34478 to 13400 And 12846 that 12576 in 12331 shall 9760 he 9665 unto 8942 I 8854
来源
在本文中,我们介绍了 Go 的 strings 包中的字符串函数。