Perl Unicode 烹饪手册:标准序言
编者按: Perl 大师 Tom Christiansen 创建并维护了一个列表,包含44个用于在Perl 5中处理Unicode的食谱。这是该系列的第一个食谱。
℞ 0: 标准序言
除非另有说明,本烹饪手册中的所有示例都需要此标准序言才能正确工作,其中#!
已调整以适应您的系统
#!/usr/bin/env perl
use utf8; # so literals and identifiers can be in UTF-8
use v5.12; # or later to get "unicode_strings" feature
use strict; # quote strings, declare variables
use warnings; # on by default
use warnings qw(FATAL utf8); # fatalize encoding glitches
use open qw(:std :utf8); # undeclared streams in UTF-8
use charnames qw(:full :short); # unneeded in v5.16
这确实会使Unix程序员使用binmode
处理您的二进制流,或者以:raw
模式打开它们,但这确实是获取它们的一种可移植方式。
警告: use autodie
和use open
不兼容。
这些特性的组合将Perl设置为已知的状态,以实现Unicode兼容性和严格性,因此后续操作将按预期执行。
本烹饪手册中的其他食谱包括
- ℞ 0: 标准序言
- ℞ 1: 始终分解和重新组合
- ℞ 2: 微调Unicode警告
- ℞ 3: 启用UTF-8字面量
- ℞ 4: 字符及其编号
- ℞ 5: 按编号的Unicode字面量
- ℞ 6: 按编号获取字符名称
- ℞ 7: 按名称获取字符编号
- ℞ 8: Unicode命名字符
- ℞ 9: Unicode命名字符序列
- ℞ 10: 自定义命名字符
- ℞ 11: CJK代码点的名称
- ℞ 12: 显式编码/解码
- ℞ 13: 将@ARGV解码为UTF-8
- ℞ 14: 将@ARGV解码为本地编码
- ℞ 15: 将标准文件句柄解码为UTF-8
- ℞ 16: 将标准文件句柄解码为区域编码
- ℞ 17: 使文件I/O默认为UTF-8
- ℞ 18: 使所有I/O默认为UTF-8
- ℞ 19: 指定文件的编码
- ℞ 20: Unicode大小写
- ℞ 21: 不区分大小写的比较
- ℞ 22: 匹配Unicode换行序列
- ℞ 23: 获取字符类别
- ℞ 24: 在内置字符类别中禁用Unicode感知
- ℞ 25: 在正则表达式中匹配Unicode属性
- ℞ 26: 自定义字符属性
- ℞ 27: Unicode归一化
- ℞ 28: 转换非ASCII Unicode数字
- ℞ 29: 在正则表达式中匹配Unicode字符集群
- ℞ 30: 使用字符集群而不是代码点提取(正则表达式)
- ℞ 31: 使用字符集群而不是代码点提取(substr)
- ℞ 32: 按字符集群反转字符串
- ℞ 33: 字符图形长度
- ℞ 34: Unicode 打印列宽度
- ℞ 35: Unicode 排序
- ℞ 36: 不区分大小写和重音符号的排序
- ℞ 37: Unicode 区域设置排序
- ℞ 38: 使 cmp 在文本上工作而不是在码点上
- ℞ 39: 不区分大小写和重音符号的比较
- ℞ 40: 不区分大小写和重音符号的区域设置比较
- ℞ 41: Unicode 换行
- ℞ 42: 难以处理的库中的 Unicode 文本
- ℞ 43: DBM 文件中的 Unicode 文本(简单方法)
- ℞ 44: Unicode 排序和打印演示
- ℞ 45: 更多资源
标签
反馈
这篇文章有什么问题吗?请通过在 GitHub 上打开问题或拉取请求来帮助我们。