Perl Unicode 美食菜谱:自定义字符属性

℞ 26: 自定义字符属性

在正则表达式中匹配 Unicode 属性 解释了每个 Unicode 字符都有一或多个属性,这些属性由 Unicode 联盟指定。您可以将这些规则扩展以定义自己的属性,以便 Perl 可以使用它们。

自定义属性是一个以 InIs 开头的函数,它返回一个符合特殊格式的字符串。perldoc perlunicode 中的“用户定义字符属性”部分更详细地描述了此格式。

在编译时定义您自己的自定义字符属性以在正则表达式中使用

 # using private-use characters
 sub In_Tengwar { "E000\tE07F\n" }

 if (/\p{In_Tengwar}/) { ... }

 # blending existing properties
 sub Is_GraecoRoman_Title {<<'END_OF_SET'}
 +utf8::IsLatin
 +utf8::IsGreek
 &utf8::IsTitle
 END_OF_SET

 if (/\p{Is_GraecoRoman_Title}/ { ... }

上一页: ℞ 25: 在正则表达式中匹配 Unicode 属性

系列索引: 标准序言

下一页: ℞ 27: Unicode 规范化

标签

反馈

这篇文章有什么问题吗?请在 GitHub 上打开问题或拉取请求,以帮助我们。