copipe Python | 文章中の単語の出現回数を調べる。

概要

janomeをインストール(pip install janome)することで、自然言語処理を実行できるようになる。Analyzer()でフィルターを設定し、analyze()で出現回数を数えることができる。

コード

from janome.tokenfilter import *
from janome.analyzer import Analyzer
text = '吾輩わがはいは猫である。名前はまだ無い。どこで生れたかとんと見当けんとうがつかぬ。・・・'
a = Analyzer(token_filters=[POSKeepFilter(['名詞']), TokenCountFilter()])
data = a.analyze(text)
for x, y in data:
    print(x, y)

結果

吾輩 28
わがはい 1
猫 9
名前 2
どこ 2
見当 1
何 8
所 4
ニャーニャー 1
・・・