标签正则下的文章

正则表达式阶段性记录

作者: 风起

时间: February 8, 2022

分类: Unix

昨天在写一个diff脚本的时候，需要过滤#开头的注释，以及过滤掉过滤#后出现的空行，Google后我的脚本变成了grep -v '^#' | grep -v '^$' 这样，可用但是并太不明白^$的意思，猜测可能是开始即结束？

因为我尝试加上几个空格匹配会失败，且改成 grep -v '^#'|grep -Ev '^\s+$' 是可以的，今天又搜了下想确认猜测，然而并没有找到相关的说明，但是也有其他收获。

首先是梳理了下正则的各种分支和规范，比如POSIX、Perl、RE2等以及包含的子集。

其次是匹配包括换行的写法，以前在写PHP的时候比较习惯使用flag，比如i、s、U这些，现在又多了几种写法：[\s\S]*、[\d\D]*、[\w\W]*、[\v\V]*、[\h\H]*。

是不是挺迷惑，我一开始也是，那现在再来回顾下语法：

\d    数字，[0-9]
\D    非数字，[^0-9]
\s    白空格，[\t\n\f\r ]
\S    非白空格，[^\t\n\f\r ]
\w    整个单词，[0-9A-Za-z_]
\W    非整个单词，[^0-9A-Za-z_]
\h    水平空格
\H    非水平空格
\v    垂直空格
\V    非垂直空格

- 阅读剩余部分 -

正则表达式阶段性记录

最新文章

最近回复

归档

其它

标签 正则 下的文章

正则表达式阶段性记录

最新文章

最近回复

归档

其它

标签正则下的文章