日本語と正規表現

■日本語の判定をしたい場合の参考
・日本語の扱い on RUby
http://www.ruby-lang.org/ja/man/?cmd=view;name=FAQ%3A%3A%C6%FC%CB%DC%B8%EC%A4%CE%BC%E8%A4%EA%B0%B7%A4%A4

日本語と正規表現

http://d.hatena.ne.jp/toton/20051102/1130971334
http://homepage2.nifty.com/buckeye/software/helps/st/pages/regular.html
http://digit.que.ne.jp/work/wiki.cgi?Perl%E3%83%A1%E3%83%A2%2F%E6%97%A5%E6%9C%AC%E8%AA%9E%E3%81%AE%E6%89%B1%E3%81%84


ちなみに、全角ひらがな、カタカナ、漢字にマッチする正規表現は次の通り。
/^[・ぁ-ヴー一-龠]+$/u
注意は、日本語の場合、文字コードによって配置が異なるので、これはUTF8用。漢字の範囲指定など、SHIFT-JISだと
結構違う。詳しくは上記のサイトで。


但し、上記の表現だと佐々木の「々」や山粼の「粼」をはじく可能性がある。(携帯の時でやったからSJISの方で
やらないといけなかったかも)
その時は、許可を正規表現で書くより、禁止を書くほうがいい場合がある。その際に、半角記号は以下のようにかける。
/!-\//