https://pypi.python.org/packages/source/r/rfZenHan/rfZenHan-0.4.zip
rfZenHan.py 全角半角その他を変換するライブラリです。
- 文字種別ごとに全角半角を変換できる。
- cp932(Windows-31J)の特殊文字を一般化できる。
- ファイルシステム上安全な文字に変換できる。
- 個別に変換ルールを設定することで、英数記号は半角、カナは全角といった変換が一発で可能。
- PerlのライブラリUnicode::Japaneseの全角半角変換メソッド互換。
http://d.hatena.ne.jp/dayflower/20060530/1148951624
>>> import rfZenHan
>>> print rfZenHan.h2z(u" 012ABCabc!@#アイウガダパ㈱:")
012ABCabc!@#アイウガダパ㈱:
>>> rfzh = rfZenHan.z2hI()
>>> print rfzh.conv(u" 012ABCabc!@#アイウガダパ(株):")
012ABCabc!@#アイウガダパ(株):
>>> rfzh = rfZenHan.rfZenHan() # use Normalize
>>> print rfzh.conv(u" 012ABCabc!@#アイウガダパ㈱:")
012ABCabc!@#アイウガダパ(株):
>>> hoge2fuga = (["hoge"], ["fuga"], [{"e": 3}])
>>> rfzh = rfZenHan.rfZenHan(hoge2fuga)
>>> print rfzh.conv(u"hohogege")
hofugage
変換対象文字列はUnicode前提です。
変換されてない場合は事前に変換して渡してください。
>>> # リテラルの場合は""の前にuをつける。
>>> print rfZenHan.h2z(u" 012ABCabc!@#アイウガダパ㈱:")
>>> # それ以外はunicode()関数で変換する。
>>> print rfZenHan.h2z(unicode(utf8str, "utf-8"))
rfzenhan コマンドが使えます。
標準入力またはファイルから読み込んで変換処理を行います。
https://github.com/hATrayflood/rfZenHan
https://pypi.python.org/pypi/rfZenHan
https://launchpad.net/~h-rayflood/+archive/python2
The MIT License (MIT)
http://opensource.org/licenses/mit-license.php