LINUX grep

grep命令

功能:输入文件的每一行中查找字符串。

基本用法:

grep [-acinv] [--color=auto] [-A n] [-B n] ‘搜寻字符串‘ 文件名 参数说明: -a:将二进制文档以文本方式处理 -c:显示匹配次数 -i:忽略大小写差异 -n:在行首显示行号 -A:After的意思,显示匹配字符串后n行的数据 -B:before的意思,显示匹配字符串前n行的数据 -v:显示没有匹配行-A:After的意思,显示匹配部分之后n行-B:before的意思,显示匹配部分之前n行 --color:以特定颜色高亮显示匹配关键字

     –color选项是个非常好的选项,可以让你清楚的明白匹配了那些字符。最好在自己的.bashrc或者.bash_profile文件中加入:

alias grep=grep --color=auto

     每次grep搜索之后,自动高亮匹配效果了。

     ‘搜寻字符串’是正则表达式,注意为了避免shell的元字符对正则表达式的影响,请用单引号(’’)括起来,千万不要用双引号括起来("”)或者不括起来。

     正则表达式分为基本正则表达式和扩展正则表达式。下面分别简单总结一下。

基本正则表达式

     正则表达式学习,主要是对正则表达式元数据的学习。正则表达式本身没有什么高深的东西,本文仅仅对基本正则表达式的元数据进行一下总结:

元数据

意义和范例

^word 搜寻以word开头的行。

 

例如:搜寻以#开头的脚本注释行

grep –n ‘^#’ regular.txt

 

word$ 搜寻以word结束的行

 

例如,搜寻以‘.’结束的行

grep –n ‘.$’ regular.txt

 

. 匹配任意一个字符。

 

例如:grep –n ‘e.e’ regular.txt

匹配e和e之间有任意一个字符,可以匹配eee,eae,eve,但是不匹配ee。

 

\ 转义字符。

 

例如:搜寻’,’是一个特殊字符,在正则表达式中有特殊含义。必须要先转义。

grep –n ‘\” regular.txt

 

* 前面的字符重复0到多次。

 

例如匹配gle,gogle,google,gooogle等等

grep –n ‘go*gle’ regular.txt

 

[list] 匹配一系列字符中的一个。

 

例如:匹配gl,gf。

grep –n ‘g[lf]’ regular.txt

 

[n1-n2] 匹配一个字符范围中的一个字符。

 

例如:匹配数字字符

grep –n ‘[0-9]’ regular.txt

 

[^list] 匹配字符集以外的字符

 

例如:grep –n ‘[^o]‘ regular.txt

匹配非o字符

 

\{n1,n2\} 前面的字符重复n1,n2次

 

例如:匹配google,gooogle。

grep –n ‘go\{2,3\}gle’ regular.txt

 

\ 单词是的开头。

 

例如:匹配以g开头的单词

grep –n ‘\

 

word\> 匹配单词结尾

 

例如:匹配以tion结尾的单词

grep –n ‘tion\>’ regular.txt

 

扩展正则表达式

     grep一般情况下支持基本正则表达式,可以通过参数-E支持扩展正则表达式,另外grep单独提供了一个扩展命令叫做egrep用来支持扩展正则表达式,这条命令和grep -E等价。虽然一般情况下,基本正则表达式就够用了。特殊情况下,复杂的扩展表达式,可以简化字符串的匹配。

     扩展正则表达式就是在基本正则表达式的基础上,增加了一些元数据。

元数据

意义和范例

+ 重复前面字符1到多次。

 

例如:匹配god,good,goood等等字符串。

grep –nE go+d’ regular.txt

 

? 匹配0或1次前面的字符

 

例如,匹配gd,god

grep –nE ‘go?d’ regular.txt

 

| 或(or)的方式匹配多个字串  
例如:grep –nE ‘god|good’ regular.txt

 

匹配god或者good。

 

() 匹配整个括号内的字符串,原来都是匹配单个字符

 

例如:搜寻good或者glad

grep –nE ‘g(oo|la)’ regular.txt

 

() 前面的字符重复0到多次。

 

例如匹配gle,gogle,google,gooogle等等

grep –nE ‘go*gle’ regular.txt

 

下面具体说明grep选项的含义和用法。
 
1、-c选项: -c选项表示输出匹配字符串行的数量。
例子:#输出文件00.pem中包含jk的行的数量
$ grep -c jk 00.pem
6
 
2、-n选项:列出所有的匹配行,并输出行号。
例子:#输出文件00.pem中包含jk行的行号和行。
$ grep -n jk 00.pem
1:jkfrdjkfdkl
2:dkjfkjkjelkrge
4:frjkj-----------kltijkert
9:fjkdkle;roitoer
13:djkfthe the23
14:the jejk ekj44
 
3、-选项: 显示不包含模式的所有行。
例子:#输出文件00.pem中不包含jk的行的数量
$ grep -vc jk 00.pem
12
 
4、-i选项: 表示grep命令不区分大小写。
例子:#输出文件00.pem中包含 jk(不论大小写)的行
$ grep -i jk 00.pem
Jkfrdjkfdkl
dkjfkjkjelkrge
frjkj-----------kltijkert
fJKdkle;roitoer
djkfthe the23
the jejk ekj44
 
5、-h选项: 表示查询多文件时不显示文件名。
 
6、-l选项: 表示只列出符合匹配的文件名,而不列出具体匹配行。
 
7、-s选项: 表示不显示不存在或无匹配文本的错误信息。
例1:#未使用-s选项,打印错误信息
$ grep jk dk 00.pem
grep: dk: 没有那个文件或目录
00.pem:Jkfrdjkfdkl
00.pem:dkjfkjkjelkrge
00.pem:frjkj-----------kltijkert
00.pem:the jejk ekj44
 
例2:#使用-s选项后,不打印错误信息
$ grep -s jk dk 00.pem
00.pem:Jkfrdjkfdkl
00.pem:dkjfkjkjelkrge
00.pem:frjkj-----------kltijkert
00.pem:the jejk ekj44
 
8、-r选项: 表示递归搜索,不仅搜索当前目录,而且搜索子目录。
 
9、-w和-x选项: 
 -w选项表示匹配整词,即以模式的字面意思去解析它。
 -x选项是匹配整行,即只有当文件中有整行内容与模式匹配时,grep命令才输出改行结果。
 
例:说明grep命令的-w和-x选项的区别
 
$ cat world.txt
Hello World
World
World Cup
African
One One World
$
 
#搜索包含单词“World”的文本行
$ grep -w ‘World‘ world.txt
Hello World
World
World Cup
One One World
$
 
#搜索整行文本是单词“World”的行
$ grep -x ‘World‘ world.txt
World
&
 
10、-q选项: 表示grep将不再输出任何结果,而是以退出状态表示搜索是否成功。0表示成功,1表示未搜索到满足模式的文本行,2表示命令或程序由于错误而未能执行
 
例1:grep命令搜索成功
$ grep -q -x ‘World‘ world.txt
$ echo $?
0
$
 
例2:grep命令未搜索到满足模式的文本行
$ grep -q -x ‘World African‘ world.txt
$ echo $?
1
$
 
例3:grep命令执行失败
$ grep -q -x ‘World African‘ world
grep : world : 没有那个文件或目录
$ echo $?
2
$
 
11、-b和-o选项:
 grep -b选项打印匹配行距文件头部的偏移量,以字节为单位。如果在-b选项后面再加上-o选项,grep命令将打印匹配的词距文件头部的偏移量。
例1:#第一条命令:打印匹配行距文件头部的偏移量
$ grep -b -w ‘World‘ world.txt
0:Hello World
12:World
18:World Cup
36:One One World
$
 
例2:#第一条命令:打印匹配词距文件头部的偏移量
$ grep -b  -o -w ‘World‘ world.txt
6:World
12:World
18:World
44:World
$
 
下面介绍一下grep和正则表达式结合使用的例子。
 
1、匹配行首:
元字符“^”表示行首,如果需要匹配.pem为后缀的文件中以橫杠“-”开头的行,可输入如下命令:
$ grep ^- *.pem
 
2、设置大小写:
利用-i符号可以使grep命令不区分大小写,[ ]符号也可以实现这一功能。
例如: 
$ grep -n [Jj][Kk] 00.pem
Jkfrdjkfdkl
dkjfkjkjelkrge
frjkj-----------kltijkert
fJKdkle;roitoer
the jejk ekj44
 
3、匹配重复字符:
可以用“.”符号和“*”符号来实现。
例1:grep和.符号
#表示搜索00.pem文件中以/字符开始、中间4个任意字符、第6个字符仍为/的行。
$ grep ^/..../ 00.pem
/home/globus/fff.pem
 
例2:grep和*符号
#表示搜索00.pem文件中以“-”开头,重复“-”符号任意次,然后是B字符的行。
$ grep ^-*B 00.pem
----------Bkjfkerj
 
4、转移符:
如果匹配的目标字符串包含的元字符,则需要用转义符“\”屏蔽其意义。
例: #搜索“-”符号重复5次的文本行。
$ grep ‘\-\{5\}‘ 00.pem
----------Bkjfkerj
frjkj----------Bkltijkert
riuitieoe---erj-----rg
 
5、POSIX字符类:
类名                                   意义
[:upper:]                             表示大写字母[A-Z]
[:lower:]                              表示小写字母[a-z]
[:digit:]                                表示阿拉伯数字[0-9]
[:alnum:]                             表示大小写字母和阿拉伯数字[0-9 a-z A-Z]
[:space:]                             表示空格或Tab键        
[:alpha:]                              表示大小写字母[a-z A-Z]
[:cntrl:]                                表示Ctrl键
[:graph:][:print:]                   表示ASCII码33-16之间的字符
[:xdigit:]               表示16进制数字[0-9 A-F a-f]
 
6、精确匹配:
正则表达式中的“\<\>”用于精确匹配。
例子:
$ grep the 00.pem          #列出包含the字符串的行
the jskj ‘dff
ddfd df the rlt
gkjtuthelr112
dkfthe the23
the jejk ekj44
jhh lk klrthe ‘f‘
$
 
$ grep "\" 00.pem         #精确匹配the这个单词
the jskj ‘dff
ddfd df the rlt
the jejk ekj44
 
7、或字符
或字符“|”是扩展的正则表达式中定义的,grep需要加上-E才能支持它。grep -E等价于egrep。
例:搜索00.pem中以冒号“:”或以非英文字母结尾的行。
$ egrep "[^[:alpha:]]$|:$" 00.pem
 
aslkdlsf:
tji54oio7yu:
gkjtuthelr112
dkfthe the23
the jejk ekj44
jhh lk klrthe ‘f‘
erkjgtl35:
rgjtkry67
---------------------------------------------
$ grep -E"[^[:alpha:]]$|:$" 00.pem
 
aslkdlsf:
tji54oio7yu:
gkjtuthelr112
dkfthe the23
the jejk ekj44
jhh lk klrthe ‘f‘
erkjgtl35:
rgjtkry67
----------------------------------------------------------------
 

基本正则表达式:

  ^        锚定行首的符合条件的内容
  $        锚定行尾的符合条件的内容
  ^$       表示空白行
  .        匹配任意单个字符
  *        匹配进挨在其前面的字符任意次
  .*       匹配任意长度的任意字符
  []       匹配指定范围内的任意字符
  [^]      匹配指定范围外的任意字符
  \?       匹配紧挨在其前面的字0次或1次
  \{m,n\}  匹配其前面的字符至少m次,至多n次
  \{0,n\}  匹配其前面的字符0-n次
  \{m,\}   匹配其前面的字符至少m次
  \{m\}    精确匹配m次
  \<       锚定词首
  \>       锚定词尾
  \(\)     分组

grep的常用选项

  --color=auto   自动为匹配字符添加颜色
  -v             反向选取,只显示不符合模式的行
  -o             只显示被模式匹配但的字符串,而不是整个行
  -i             不区分字符大小写
  -A  n          显示匹配到的行时,顺便显示其后面的n个行
  -B  n          显示前面的n行
  -C  n          显示后面的n行
  -E             使用扩展的正则表达式    grep -E = egrep

扩展正则表达式(在这里至列出不同之处)

   ?            出现了0次或1次 正则表达式为\?
   {m,n}         匹配前边字符最少m次,最多n次
   ()            分组,用法与grep类似
   a|b           二选一

1,锚定/etc/passwd文件中行首为root的行
     grep  “^root” /etc/passwd
2,锚定/etc/passwd文件行尾为sh的行
     grep “sh$” /etc/passwd
3,查找空白行
     grep “^$” /etc/passwd
4,匹配a后面跟了任意单个字符的行
     grep “a.” /etc/passwd
5,匹配a后面跟了任意长度字符的行
     grep “a*” /etc/passwd
4,匹配a后面跟了任意长度的任意字符,再跟上b的行
     grep “a.*b” /etc/passwd
5,匹配a后面跟了任意个一数字后又跟了任意一个字母的行
     grep “a[0-9][a-zA-Z]” /etc/passwd
6,匹配a后面跟了任意一个数字或字母的行
     grep “a[0-9a-zA-Z]” /etc/passwd
7,匹配0或1个a后面跟了个b的行
     grep “a\?b” /etc/passwd
8,匹配最少一个a,最多3个a后面跟了一个b的行
     grep “a\{1,3\}b” /etc/passwd
9,锚定单词admin的行
     grep “\” /etc/passwd
10,匹配自少出现一次ad,最多出现3次ad的行
     grep “\(ab\)\{1,3\}” /etc/passwd

郑重声明:本站内容如果来自互联网及其他传播媒体,其版权均属原媒体及文章作者所有。转载目的在于传递更多信息及用于网络分享,并不代表本站赞同其观点和对其真实性负责,也不构成任何其他建议。