色々Pythonを勉強している時の話。
ちょっと前に流行ったWordCloudの使い方もその時ちょっと調べていました。
最近はそこまでつかわれている印象はありませんが、個人的には単語を頻出を画像にできるのは好きです。
Macに切り替えたばかりの時で、MacでWordCloudを行うと日本語の表記がおかしくなりました。
文字フォントを指定したWordCloudのソースコードのサンプルをのせますのでよければ参考にしてください。
WordCloudは必須なのでインストールします。
(その他、必要なものは都度pip installで追加してください。)
pip install WordCloud
# WordCloud画像を作成する
from collections import Counter
from wordcloud import WordCloud
from typing import List
import datetime as dt
def make_wordcloud_image(words:List) -> List:
# フォントを指定する
WORDCLOUD_FONT_PATH = "/Library/Fonts/Arial Unicode.ttf"
# 画像のサイズを指定
WORDCLOUD_WIDTH = 600
WORDCLOUD_HEIGHT = 600
# 文字の色を指定する
WORDCLOUD_BG_COLOR = 'white'
# 出力先とファイル名を日付で指定
WORDCLOUD_OUTPUT_FILE = './' + dt.datetime.now().strftime('%Y%m%d') + '.png'
# 頻出ワードが何かを調べる
word_counter = Counter(words)
wordcloud = WordCloud(
font_path = WORDCLOUD_FONT_PATH,
width = WORDCLOUD_WIDTH,
height = WORDCLOUD_HEIGHT,
background_color = WORDCLOUD_BG_COLOR).generate_from_frequencies(word_counter)
wordcloud.to_file(WORDCLOUD_OUTPUT_FILE)
関数形式にしています。
引数は文字列を含んだリストになります。
また、文字のカウントはCounterを使用しています。
出力先などは必要に応じて変更して下さい。
お役に立てれば嬉しいです。