WordCloud Mac 日本語フォント

Python
本ページはプロモーションが含まれています

色々Pythonを勉強している時の話。
ちょっと前に流行ったWordCloudの使い方もその時ちょっと調べていました。

最近はそこまでつかわれている印象はありませんが、個人的には単語を頻出を画像にできるのは好きです。

Macに切り替えたばかりの時で、MacでWordCloudを行うと日本語の表記がおかしくなりました。
文字フォントを指定したWordCloudのソースコードのサンプルをのせますのでよければ参考にしてください。

WordCloudは必須なのでインストールします。
(その他、必要なものは都度pip installで追加してください。)

pip install WordCloud
# WordCloud画像を作成する
from collections import Counter
from wordcloud import WordCloud
from typing import List
import datetime as dt

def make_wordcloud_image(words:List) -> List:
    # フォントを指定する
    WORDCLOUD_FONT_PATH = "/Library/Fonts/Arial Unicode.ttf"

    # 画像のサイズを指定    
    WORDCLOUD_WIDTH = 600
    WORDCLOUD_HEIGHT = 600
    
    # 文字の色を指定する
    WORDCLOUD_BG_COLOR = 'white'
    # 出力先とファイル名を日付で指定
    WORDCLOUD_OUTPUT_FILE = './' + dt.datetime.now().strftime('%Y%m%d') + '.png'
    
    # 頻出ワードが何かを調べる
    word_counter = Counter(words)
    wordcloud = WordCloud(
        font_path = WORDCLOUD_FONT_PATH,
        width = WORDCLOUD_WIDTH,
        height = WORDCLOUD_HEIGHT,
        background_color = WORDCLOUD_BG_COLOR).generate_from_frequencies(word_counter)
    wordcloud.to_file(WORDCLOUD_OUTPUT_FILE)

関数形式にしています。
引数は文字列を含んだリストになります。
また、文字のカウントはCounterを使用しています。

出力先などは必要に応じて変更して下さい。

お役に立てれば嬉しいです。

タイトルとURLをコピーしました