NLP勉強会 #2 参加メモ
NLP勉強会 #2に参加してきた。
NLP本読み進めシリーズ 「入門 自然言語処理」第1回 (@nezuq)
1章 言語処理とPython
- 日本語を使うための設定
# MeCabとそのPythonバインディングをインストールする。
$ sudo apt-get install libmecab-dev
$ sudo apt-get install mecab mecab-ipadic-utf8
$ pip install mecab-python3
# Plotのフォントで日本語フォントを指定する
import matplotlib
import matplotlib.font_manager
- NLP関数
#NLTKパッケージ(ex.コーパス)をダウンロードする。
nltk.download()
#文書内から指定単語が使われている文を探す。
text1.concordance("単語")
続きを読む
#文書内から指定単語と同じ文脈で使われている文を探す。
text1.similar("単語")