[데이터분석] 파이썬으로 특정 키워드를 포함하는 신문기사 웹크롤링 & 워드클라우드 시각화 분석 - 1

2016. 8. 26. 14:16·데이터분석/NLP

동일한 키워드를 가지는 신문 기사를 논조가 다른 신문사에서 긁어와 사용된 단어를 워드클라우드로 시각화해 분석해보는 예제입니다.

키워드는 '사드'를 사용했고, 신문사는 동아일보, 한겨레신문 두 신문사에서 각각 150개씩 기사를 긁어왔습니다.

결과는 아래와 같습니다. (왼쪽이 동아일보, 오른쪽이 한겨레신문 입니다.)

 

 

 

키워드가 '사드'인 만큼, 워드클라우드 모양을 미사일로 만들어봤습니다.

워드클라우드를 살펴보면 동아일보는 '중국'을 한겨레신문에서는 '미국'을 가장 많이 사용했음을 알 수 있습니다.

분석환경은 우분투 16.04에서 파이썬 3.5.2버전을 사용했습니다.

다음 글 부터 사용된 라이브러리와 코드를 차근차근 살펴보도록 하겠습니다.

'데이터분석 > NLP' 카테고리의 다른 글

[데이터 분석] 파이썬으로 특정 키워드를 포함하는 신문기사 웹크롤링 & 워드클라우드 시각화 분석 - 4 (단어 사용 빈도 체크하기)  (19) 2016.09.24
[데이터분석] 파이썬으로 특정 키워드를 포함하는 신문기사 웹크롤링 & 워드클라우드 시각화 분석 - 3 (동아일보, 한겨레 '사드'관련 기사 크롤링하기)  (51) 2016.08.29
[데이터분석] 파이썬으로 특정 키워드를 포함하는 신문기사 웹크롤링 & 워드클라우드 시각화 분석 - 2 (네이버 뉴스 크롤링하기)  (31) 2016.08.26
'데이터분석/NLP' 카테고리의 다른 글
  • [데이터 분석] 파이썬으로 특정 키워드를 포함하는 신문기사 웹크롤링 & 워드클라우드 시각화 분석 - 4 (단어 사용 빈도 체크하기)
  • [데이터분석] 파이썬으로 특정 키워드를 포함하는 신문기사 웹크롤링 & 워드클라우드 시각화 분석 - 3 (동아일보, 한겨레 '사드'관련 기사 크롤링하기)
  • [데이터분석] 파이썬으로 특정 키워드를 포함하는 신문기사 웹크롤링 & 워드클라우드 시각화 분석 - 2 (네이버 뉴스 크롤링하기)
윤빵꾸
윤빵꾸
  • 윤빵꾸
    yoonpunk's study
    윤빵꾸
  • 전체
    오늘
    어제
    • 전체 글 목록 (11)
      • 데이터분석 (4)
        • NLP (4)
      • 언어 (1)
        • Python (1)
      • 데이터베이스 (0)
        • 이론 (0)
      • 개발환경 (1)
      • 알고리즘 (1)
        • 자료구조 (1)
      • 북리뷰 (2)
        • IT서적 (2)
      • 개발 원리 & 디자인 패턴 (1)
      • 오늘의 코드 (1)
      • Git (0)
  • 블로그 메뉴

    • 방명록
  • 링크

  • 공지사항

    • Contact
  • 인기 글

  • 태그

    git
    urllib
    konlpy.tag
    다이나믹 어레이
    pure function
    Java
    Python
    웹크롤링
    Java 버전관리
    품사 태깅
    list
    wordcloud
    명사 분리
    사드
    선형 자료 구조
    THAAD
    Dynamic array
    워드클라우드
    자료 구조
    Twitter()
    한글 형태소 분석
    품사 태그
    순수 함수
    파이썬
    참조 투명성
    크롤링
    Referentially Transparency
    형태소 분석
    Colletion
    Crawling
  • 최근 댓글

  • 최근 글

  • hELLO· Designed By정상우.v4.10.3
윤빵꾸
[데이터분석] 파이썬으로 특정 키워드를 포함하는 신문기사 웹크롤링 & 워드클라우드 시각화 분석 - 1
상단으로

티스토리툴바