개발공부

WordCloud 라이브러리 사용법, STOPWORDS(불용어) 처리, 배경 색, 배경 모양(mask) 설정 본문

Python/Machine Learning

WordCloud 라이브러리 사용법, STOPWORDS(불용어) 처리, 배경 색, 배경 모양(mask) 설정

mscha 2022. 5. 11. 18:09

WordCloud

wordcloud 라이브러리가 제공하고 많이 나온 단어를 시각화 할 수 있다.

 

STOPWORDS 

불용어라고 한다.

필요없는 단어를 지칭한다.

 

예제

아래와같은 리뷰 문자열이있다.

from wordcloud import WordCloud, STOPWORDS
import matplotlib.pyploy as plt

my_stopwords = STOPWORDS

# 불용어에 Alexa도 추가한다.
my_stopwords.add('Alexa')

# 배경색은 white 불용어는 my_stopwords
wc = WordCloud(background_color='white', stopwords= my_stopwords)

# 워드클라우드 생성
wc.generate(reviews)

plt.imshow(wc)
plt.axis('off')
plt.show()

배경모양 mask 설정

이미지 파일을 하나 가져와서 이를 마스크로 설정해보자

from PIL import Image
img = Image.open('data/cat.jpg')
img_mask = np.array(img)

WordCloud()의 파라미터에 mask = img_mask를 해준다.

from wordcloud import WordCloud, STOPWORDS
import matplotlib.pyploy as plt

my_stopwords = STOPWORDS

# 불용어에 Alexa도 추가한다.
my_stopwords.add('Alexa')

# 배경색은 white 불용어는 my_stopwords
wc = WordCloud(background_color='white', stopwords= my_stopwords, mask = img_mask)

# 워드클라우드 생성
wc.generate(reviews)

plt.figure(figsize=(10, 10))
plt.imshow(wc)
plt.axis('off')
plt.show()