Perl Unicode 美食大全:匹配 Unicode 行结束序列

℞ 22:在正则表达式中匹配 Unicode 行结束序列

Unicode 定义了多个字符提供垂直空白,如回车或换行符。Unicode 还将多个字符归入 行结束序列 的范畴。一个 Unicode 行结束可以匹配两个字符的 CRLF 图形或七个垂直空白字符中的任何一个。

perldoc perlrebackslash 中所述,正则表达式反斜杠序列 \R 匹配任何 Unicode 行结束序列。(同样,序列 \v 匹配任何单个垂直空白字符。)

这有助于处理来自不同操作系统的文本文件

 s/\R/\n/g;  # normalize all linebreaks to \n

上一节:℞ 21:不区分大小写的比较

系列索引:标准序言

下一节:℞ 23:获取字符类别

标签

反馈

这篇文章有什么问题?请通过在 GitHub 上打开问题或拉取请求来帮助我们。