Perl Unicode 羹匙书:更多资源
本系列通过实例向您展示了Unicode的几个特性,以及使用最新版Perl 5正确和容易地处理Unicode的一些技术。到现在为止,您对Unicode的了解比许多程序员都要多,但您精通Unicode的旅程仍在继续。
Perl 5 包含一些文档,解释了Unicode和Perl对Unicode的支持。请参阅 perlunicode、perluniprops、perlre、perlrecharclass、perluniintro、perlunitut 和 perlunifaq。
Perl 5 和 CPAN 提供了几个模块和发行版,允许有效地使用Unicode。截至Perl 5.16,其中许多都包含在核心库中。尽管它们与Perl 5的早期版本也能很好地工作,但要获得对Unicode的整体最佳和最正确的支持,请考虑使用Perl 5.14或5.16。
这些模块包括
- PerlIO
- DB_File
- DBM_Filter
- DBM_Filter::utf8
- Encode
- Encode::Locale
- Unicode::UCD
- Unicode::Normalize
- Unicode::GCString
- Unicode::LineBreak
- Unicode::Collate
- Unicode::Collate::Locale
- Unicode::Unihan
- Unicode::CaseFold
- Unicode::Tussle
- Lingua::JA::Romanize::Japanese
- Lingua::ZH::Romanize::Pinyin
- Lingua::KO::Romanize::Hangul
CPAN 分发 Unicode::Tussle
模块包括许多命令行程序,帮助处理Unicode,包括以下程序,以完全或部分替代标准实用工具:tcgrep 替代 egrep,uniquote 替代 cat -v 或 hexdump,uniwc 替代 wc,unilook 替代 look,unifmt 替代 fmt,和 ucsort 替代 sort。对于探索Unicode字符名称和字符属性,请参阅其 uniprops、unichars 和 uninames 程序。它还提供以下程序,所有这些程序都是通用的过滤器,执行Unicode-y操作:unititle 和 unicaps;uniwide 和 uninarrow;unisupers 和 unisubs;nfd、nfc、nfkd 和 nfkc;以及 uc、lc 和 tc。
最后,请参阅 已发布的Unicode标准(页码来自6.0.0版本),包括以下特定的附录和技术报告
- §3.13 默认大小写算法,第113页
- §4.2 大小写,第120-122页
- 大小写映射,第166-172页,特别是从第170页开始的Caseless Matching
- UAX #44:Unicode字符数据库
- UTS #18:Unicode正则表达式
- UAX #15:Unicode规范化形式
- UTS #10:Unicode排序算法
- UAX #29:Unicode文本分段
- UAX #14:Unicode换行算法
- UAX #11:东亚宽度
Tom Christiansen <[email protected]> 编写了本系列,偶尔得到 Larry Wall 和 Jeffrey Friedl 的背景评论。
这些示例大多来自“骆驼书”的当前版;即,来自 《Programming Perl》的第4版,版权所有 © 2012 Tom Christiansen 等人,2012-02-13 由 O’Reilly 媒体出版。代码本身可以自由分发,我们鼓励您将本系列中的任何示例移植、折叠、拧紧和扭曲,以包含到您自己的程序中,没有任何约束。通过代码注释进行认可是一种礼貌,但不是必需的。
上一页: ℞ 44: Unicode排序和打印演示
系列索引: 标准序言
标签
反馈
这篇文章有什么问题吗?请在GitHub上通过打开一个问题或拉取请求来帮助我们GitHub