プロフィール
 

morimori.ynct

Author:morimori.ynct
森下功啓製作所のブログです。
電子工作のことや日々思ったことを時々気まぐれに更新しています。
趣味で作っているサイトはこちら

 
最新記事
最新コメント
最新トラックバック
 
 
月別アーカイブ
カテゴリ
 
 

スポンサーサイト

 
--/--/--(--) Category : スポンサー広告
上記の広告は1ヶ月以上更新のないブログに表示されています。
新しい記事を書く事で広告が消せます。
 
Comment  |  Trackback
 
 

AnacondaのPythonから形態素解析ツールのMeCABを利用する方法

 
2014/01/25(Sat) Category : プログラミング
 Pythonから形態素解析を実行するにはいくつか選択肢があります。その中でも、日本語を対象とした場合に現時点で使いやすいものといえばMeCabだと思います。

MeCab:http://mecab.googlecode.com/svn/trunk/mecab/doc/index.html


PythonからMeCabを使うには、次の手順になります。

作業リスト
1) MeCabをインストール(Linuxだとソースをダウンロード後にmakeでビルド)
2) Pythonがx64だと、MeCabのソースコードを一部変更してビルド
3) Pythonがx64だと2)でできたlibmecab.libとmecab.hを利用して、x86だとMeCabのインストールフォルダ内のlibmecab.libとmecab.hを使ってmecab-pythonをビルド&インストール
(libmecab.libとmecab.hをmecab-pythonのsetup.pyを同じフォルダ内にコピーしてから「python setup.py build」「python setup.py install」を実行する。)
4) Pythonがx64だと2)でできたlibmecab.dll、x86だとMeCabのインストールフォルダ内のlibmecab.dllをPythonインストールフォルダ内のsite-packagesフォルダ内に配置

MeCabとmecab-pythonのダウンロードサイト:https://code.google.com/p/mecab/downloads/list


ここで、インストールするMeCabはx86版で構いません。2)のビルドにはWindowsだとMinGW(msysを含む)またはCygwin、加えてVisual Studio(VS) 2008/2010が必要になります。個人的にはMinGWをお勧めします。なお、VSはPython 2.xだとVS2008、Python 3.xだとVS2010/VS2012/VS2013を使います。

Pythonエンジンがx86だと苦労はほとんどありません。しかしながらPythonがx64だとmecabのソースコードの変更が必要になります。また、WindowsでVSが2010以前のバージョンでProfessionalでなければWindows SDKのインストールが必要となり、この設定が非常に面倒です。なお、Windows SDKはVSコンパイラのみをインストールするパッケージで、http://msdn.microsoft.com/ja-jp/windowsserver/bb980924.aspxから無料で入手できます。とはいえ、無難にVS2010 proかVS2013 Expressのインストールを勧めます。


WindowsのPython x64に対してインストールするには・・・

Windows SDKの準備に関するわかりやすいサイト:現時点では見当たりません。
mecab-python x64版をインストールする方法:http://blog.yujigraffiti.com/2013/12/mecab-python-0999windows-64bit.html




 で、肝心の表題にある「AnacondaのPythonから形態素解析ツールのMeCABを利用する方法」ですが、作業リストの3)において工夫が必要です。まずAnacondaのPythonはgccでビルドされているのでそのままではbuildコマンドを実行できません。MeCabはWindowsにおいてはVSを使ってコンパイルするようにソースコードが作られているためです。そこで、buildコマンドにmscvコンパイラを指定するオプションを追加します。また、もしAnacondaで作った仮想環境に導入する場合はactivateコマンドを使ってデフォルトのPythonエンジンを切り替えて作業します。

buildコマンド
「python setup.py build --compiler=mscv」


[2014-07-09] 少し追記しました。
関連記事
スポンサーサイト
 
コメントアイコン Comment0  |  Trackback0
 
 

Trackback

 

Trackback URL :
この記事にトラックバックする(FC2ブログユーザー)

 
 

Comment

 

    
 
Home | Top ▲
 
検索フォーム
 
 
RSSリンクの表示
リンク
ブロとも申請フォーム
QRコード
 
QR
 
 
上記広告は1ヶ月以上更新のないブログに表示されています。新しい記事を書くことで広告を消せます。