在Bash中将字符串拆分成数组

  • 本站文章除注明转载外,均为本站原创或者翻译。
  • 本站文章欢迎各种形式的转载,但请18岁以上的转载者注明文章出处,尊重我的劳动,也尊重你的智商;
  • 本站部分原创和翻译文章提供markdown格式源码,欢迎使用文章源码进行转载;
  • 本博客采用 WPCMD 维护;
  • 本文标题:在Bash中将字符串拆分成数组
  • 本文链接:http://zengrong.net/post/1591.htm

在Bash中将字符串拆分成数组

split string to array in bash

和AS中的String.split不同,Bash没有类似的语法,但它实在是太灵活了,有很多种方式可以做类似的事情。

以前我写过一篇 Bash数组操作教程 ,今天使用Bash做文件处理的时候,发现有必要再写一篇将字符串拆分成数组的教程。但发现有人已经写了更好的教程在前面了,于是就偷懒转过来好了。

下面的内容转自Bash @ Linux


以空白作为分隔符来拆分字符串构造数组

ARR=($STR)

注意$STR不能加引号。

STR="Hello World" 
ARR=($STR) 
declare -p ARR 
declare -a ARR='([0]="Hello" [1]="World")'

用指定分隔符来拆分字符串构造数组

如果分隔符不是空白,而是别的,那么需要借助IFS变量。

default IFS (Internal Field Separator, which is space/tab/new line)

echo $PATH 
/usr/kerberos/sbin:/usr/kerberos/bin:/usr/apache/apache-ant-1.7.1/bin:/usr/local/sbin:/usr/local/bin:/sbin:/bin:/usr/sbin:/usr/bin:/root/bin
IFS=: DIRS=($PATH) 
declare -p DIRS   
declare -a DIRS='([0]="/usr/kerberos/sbin" [1]="/usr/kerberos/bin" [2]="/usr/apache/apache-ant-1.7.1/bin" [3]="/usr/local/sbin" [4]="/usr/local/bin" [5]="/sbin" [6]="/bin" [7]="/usr/sbin" [8]="/usr/bin" [9]="/root/bin")'

但是下面的方式是不行的。

echo $PATH 
/usr/kerberos/sbin:/usr/kerberos/bin:/usr/apache/apache-ant-1.7.1/bin:/usr/local/sbin:/usr/local/bin:/sbin:/bin:/usr/sbin:/usr/bin:/root/bin
IFS=: declare -a DIRS=($PATH) 
declare -p DIRS 
declare -a DIRS='([0]="/usr/kerberos/sbin:/usr/kerberos/bin:/usr/apache/apache-ant-1.7.1/bin:/usr/local/sbin:/usr/local/bin:/sbin:/bin:/usr/sbin:/usr/bin:/root/bin")'

使用read -a来拆分字符串构造数组

All work and no play makes Jack a dull boy.
只会用功不玩耍,聪明孩子也变傻。

PROVERB="All work and no play makes Jack a dull boy." 
read -a WORDS <<< $PROVERB 
echo "$WORDS" 
All
echo "${#WORDS}" 
3
echo "${WORDS[*]}" 
All work and no play makes Jack a dull boy.
echo "${WORDS[@]}" 
All work and no play makes Jack a dull boy.
echo "${#WORDS[*]}" 
10
echo "${#WORDS[@]}" 
10

前面的例子中要分割的字符串是以空格分割的,现在举一个以:分割的例子。

echo $IFS 
IFS=: read -r -a DIRS <<< "$PATH" 
echo $IFS 
declare -p DIRS 
declare -a DIRS='([0]="/usr/kerberos/sbin" [1]="/usr/kerberos/bin" [2]="/usr/apache/apache-ant-1.7.1/bin" [3]="/usr/local/sbin" [4]="/usr/local/bin" [5]="/sbin" [6]="/bin" [7]="/usr/sbin" [8]="/usr/bin" [9]="/root/bin")'

下面的例子是将当前工作目录以/进行分割。

echo $PWD 
/root/work191/ct08/src/ctmw
IFS=/ read -r -a PARTS <<< $PWD 
declare -p PARTS 
declare -a PARTS='([0]=" root work191 ct08 src ctmw")'
IFS=/ read -r -a PARTS <<<"$PWD" 
declare -p PARTS                 
declare -a PARTS='([0]="" [1]="root" [2]="work191" [3]="ct08" [4]="src" [5]="ctmw")'

使用cut命令分隔字符串

echo "$STR" | cut -f $N

以TAB分隔,打印第N个子串值,N从1开始计数。

echo "$STR" | cut -d "$DELIM" -d $N

以指定DELIM分隔,打印第N个子串值,N从1开始计数。
其中,-d部分也可以是$N1,$N2,$N3的形式,即输出多个子串。

A good beginning is half done.
良好的开端是成功的一半。

STR="A good beginning is half done." 
echo $STR | cut -d ' ' -f 2          
good
echo $PATH 
/usr/kerberos/sbin:/usr/kerberos/bin:/usr/apache/apache-ant-1.7.1/bin:/usr/local/sbin:/usr/local/bin:/sbin:/bin:/usr/sbin:/usr/bin:/root/bin
echo $PATH | cut -d ':' -f 3 
/usr/apache/apache-ant-1.7.1/bin
echo $PATH | cut -d ':' -f 3,5 
/usr/apache/apache-ant-1.7.1/bin:/usr/local/bin

使用awk命令分隔字符串

echo "$STR" | awk '{print $1}'
echo "$STR" | awk '{print $2}'

注意:awk后面的参数用单引号,不能用双引号。

STR="A good beginning is half done." 
echo "$STR" | awk '{print $1}' 
A
echo "$STR" | awk '{print $2}' 
good
echo "$STR" | awk '{print $5,$6}' 
half done.