Perl Unicode 美食菜谱:自定义字符属性
℞ 26: 自定义字符属性
在正则表达式中匹配 Unicode 属性 解释了每个 Unicode 字符都有一或多个属性,这些属性由 Unicode 联盟指定。您可以将这些规则扩展以定义自己的属性,以便 Perl 可以使用它们。
自定义属性是一个以 In
或 Is
开头的函数,它返回一个符合特殊格式的字符串。perldoc perlunicode 中的“用户定义字符属性”部分更详细地描述了此格式。
在编译时定义您自己的自定义字符属性以在正则表达式中使用
# using private-use characters
sub In_Tengwar { "E000\tE07F\n" }
if (/\p{In_Tengwar}/) { ... }
# blending existing properties
sub Is_GraecoRoman_Title {<<'END_OF_SET'}
+utf8::IsLatin
+utf8::IsGreek
&utf8::IsTitle
END_OF_SET
if (/\p{Is_GraecoRoman_Title}/ { ... }
上一页: ℞ 25: 在正则表达式中匹配 Unicode 属性
系列索引: 标准序言
下一页: ℞ 27: Unicode 规范化
标签
反馈
这篇文章有什么问题吗?请在 GitHub 上打开问题或拉取请求,以帮助我们。