正規表現 Tips - 文字列の形式をチェック
Unicode は文字コードの範囲を名前で定義しています。ここを参照してください。例えば、
です。 Unicode 対応の正規表現エンジンでは、
で表すことができます。プリフィックスは処理系により違い、
となります。
文字の種類 | 文字コード | ブロック名 |
---|---|---|
ひらがな | 3040..309F | Hiragana |
カタカナ | 30A0..30FF | Katakana |
漢字 | 3400..4DBF | CJK Unified Ideographs Extension A |
です。 Unicode 対応の正規表現エンジンでは、
\p{プリフィックス + ブロック名}
で表すことができます。プリフィックスは処理系により違い、
処理系 | プリフィックス | 例 |
---|---|---|
Java (java.util.regex)&br;Perl | In | \p{InCJKUnifiedIdeographsExtensionA} |
.NET Framework | Is | \p{IsCJKUnifiedIdeographsExtensionA} |
PHP | 使えない |
となります。
2005年11月04日(金) 18:24:24 Modified by uguuxp