Q&A
HOME >> 커뮤니티 >> Q&A

워드클라우드 생성기로 시각화 이미지 만드는 법

페이지 정보

작성자 Evelyn 작성일25-07-26 04:17 조회2회 댓글0건

본문

뉴스에서 워드클라우드 워드 클라우드 워드아트 생성기 만들기 사이트 단어시각화 프로그램 워드클라우드생성기 태그 워드크라우드 추천 어플 가장 많이 언급되는 단어는 무엇일까요? 이전 포스팅에서 서술형 데이터를 분석할 때는 워드 클라우드를 사용하는 것이 트렌드를 직관적으로 파악하기 좋다는 것을 확인하였습니다.▼이전 포스팅: 워드 클라우드, 언제 어떻게 사용해야 할까?[BY 한빛미디어] 워드 클라우드는 말 그대로 다양한 단어가 구름처럼 떠있는 차트입니다. 그렇다고 단어...​뉴스에서 가장 많이 언급되는 단어를 알아보기 위해여러 데이터 시각화 도구 중 태블로를 사용하여, 웹사이트에서 제공하는 한국언론진흥재단 뉴스 빅 데이터로 워드 클라우드를 만들어보겠습니다.​예제 파일 다운로드:  07_한국언론진흥재단_뉴스 빅 데이터_뉴스 토픽.csv더 넓은 세상, 더 나은 미래를 위한 아시아 출판 네트워크 :: 한빛미디어, 한빛아카데미, 한빛비즈, 한빛라이프, 한빛에듀​1단계: 데이터 준비하기다음 표는 예제 파일의 일부 데이터만을 보여 줍니다. 실제 예제 파일은 3,660개의 행으로 구성되어 있으며 키워드 열도 있습니다. 이번에 보여드릴 실습에서는 예제 파일에 있는 모든 데이터를 활용합니다. 예제 파일에서 다루는 항목은 일자, 순위, 토픽1, 토픽2, 토픽3, 토픽4, 토픽5, 토픽6, 토픽 키워드로 총 9 가지입니다.한국언론진흥재단 뉴스 빅 데이터 뉴스 워드클라우드 워드 클라우드 워드아트 생성기 만들기 사이트 단어시각화 프로그램 워드클라우드생성기 태그 워드크라우드 추천 어플 토픽 데이터 중 일부* 예제 파일의 토픽은 1~6까지 나뉘어 있지만, 웹 사이트에서 제공하는 원 데이터는 하나의 토픽 열에 모든 토픽 내용이 담겨 있습니다. 원 데이터로 실습을 진행하는 경우 엑셀 등을 사용해 토픽을 6열로 나눠야 합니다.​​2단계: 데이터로 알고 싶은 내용 질문하기데이터 시각화에 앞서 데이터를 바탕으로 답할 수 있는 질문에는 어떤 것이 있는지 반드시 고민해 보세요.​*뉴스 토픽 데이터로 떠올려볼 수 있는 질문- 2012년에 많이 언급된 토픽은 무엇인가?- 시간의 흐름에 따라 토픽의 빈도수에 차이가 있는가?​우리는 매일 수많은 뉴스를 접합니다. 뉴스의 홍수 속에서 언급되는 주제와 단어를 파악할 수만 있다면 현재 우리 사회의 이슈를 보다 빠르게 이해할 수 있죠. 그러므로 워드 클라우드를 만들어 보면서 뉴스 토픽과 관련된 다양한 질문에 답해 보겠습니다. 우선 ‘2012년에 많이 언급된 토픽은 무엇인가?’라는 질문부터 답해볼까요?​​3단계: 워드 클라우드 만들기(실습 시작!)01 '07_한국언론진흥재단_뉴스 빅 데이터_뉴스 토픽.csv’ 파일을 불러옵니다. 본격적으로 실습을  진행하기에 앞서 자연어 데이터 전처리 작업을 해야 하므로 이번 실습은 [데이터 원본] 탭에서부터 시작하겠습니다. ​​​02 [데이터 원본] 탭의 데이터 그리드를 살펴보면 [토픽1]~[토픽6]이 각각의 필드로 분리되어 있 습니다. [토픽1]~[토픽6]을 따로 관리하면 번거로우므로 하나의 필드로 묶어줄게요. [토픽1]에서 [토픽6]까지 드래그한 다음 마우스 오른쪽 버튼을 클릭해서 ‘피벗’을 선택합니다. 이러면 데이 터 그리드 오른쪽 끝에 [피벗 필드명]과 [피벗 필드 값]이 추가됩니다.* 태블로의 피벗 기능은 데이터의 방향을 워드클라우드 워드 클라우드 워드아트 생성기 만들기 사이트 단어시각화 프로그램 워드클라우드생성기 태그 워드크라우드 추천 어플 바꾸는 기능입니다. 다시 말해, 피벗 기능을 사용하면 행으로 된 데이터를 열로 바꾸거나 열로 된 데이터를 행으로 바꿀 수 있습니다.​​​03 이제 본격적으로 워드 클라우드를 만들어볼게요. [시트 1] 탭으로 이동한 다음 [데이터] 패널의 [피벗 필드 값]을 [필터] 선반으로 드래그합니다. [필터] 대화상자에서 ‘목록에서 선택(s)’를 선택하고 [Null]을 체크 해제한 다음 [확인] 버튼을 클릭합니다.​​​04 [피벗 필드 값]에 포함되어 있는 단어들을 뷰에 나열하기 위해 Ctrl 키를 누른 채로 [필터] 선반에서 [피벗 필드 값]을 [마크] 카드의 텍스트로 드래그합니다.​​​05 [데이터] 패널에서 [07_한국언론진흥재단_뉴스 빅 데이터_뉴스 토픽.csv]를 [마크] 카드의 크 기로 드래그합니다. 이러면 [07_한국언론진흥재단_뉴스 빅 데이터_뉴스 토픽.csv]가 [카운트 (07_한국언론진흥재단_뉴스 빅 데이터_뉴스 토픽.csv)]로 바뀌면서 자동으로 트리맵 차트라는 것이 만들어져요.​​​06 이제 자동 생성된 트리맵 차트를 워드 클라우드로 바꾸겠습니다. [마크] 카드의 드롭다운 버튼을 클릭해서 ‘텍스트’를 선택합니다. 워드클라우드 워드 클라우드 워드아트 생성기 만들기 사이트 단어시각화 프로그램 워드클라우드생성기 태그 워드크라우드 추천 어플 단어별 사용 빈도수에 따라 크기가 설정된 워드 클라우드가 만들어졌습니다!​​​07 단어가 너무 많아서 어떤 단어가 중요한 단어인지 알아보기 힘드네요. 최소 빈도수를 설정해서 핵심 단어를 추출할게요. [데이터] 패널에서 [07_한국언론진흥재단_뉴스 빅 데이터_뉴스 토픽.csv]를 [필터] 선반으로 드래그합니다.​​​08 [필터] 대화상자의 첫 번째 입력 칸에서는 최소 빈도수를, 두 번째 입력 칸에서는 최대 빈도수를 설정할 수 있습니다. 첫 번째 입력 칸에 ‘10’을 입력하고 [확인] 버튼을 클릭합니다. 이러면 사용 빈도수가 최소 10회 이상인 단어만 워드 클라우드로 표현됩니다.​​​09 글자에 순차형 색상 배합을 적용하기 위해 Ctrl 키를 누른 채로 [마크] 카드의 [카운트(07_한국 언론진흥재단_뉴스 빅 데이터_뉴스 토픽.csv)]를 색상으로 드래그합니다.​​​10 이제 워드클라우드 워드 클라우드 워드아트 생성기 만들기 사이트 단어시각화 프로그램 워드클라우드생성기 태그 워드크라우드 추천 어플 워드 클라우드의 글자색을 바꿔보겠습니다. [마크] 카드의 색상( )을 클릭해서 색상 편집을 클릭합니다. [색상 편집] 대화상자에서 [색상표]의 드롭다운 버튼을 클릭하고 ‘주황색-금색’을 선택한 후 [단계별 색상]을 체크한 다음 [확인] 버튼을 클릭합니다.​11 이제 글자색이 주황색 순차형 배합으로 바뀌면서 그럴 듯한 워드 클라우드가 완성되었어요.​​​4단계: 질문에 답해보기Q1. 2012년에 가장 많이 언급된 토픽은 무엇인가?A1. 예제 파일은 2012년의 뉴스 토픽입니다. 해당 연도의 토픽으로 후보, 민주, 대선, 대통령과 같은 대선 관련 단어가 많이 등장한다는 사실로 미루어 봤을 때, 대통령 선거가 있었던 해라는 사실을 쉽게 유추할 수 있습니다.​Q2. 시간의 흐름에 따라 토픽의 빈도수에 차이가 있는가?A2. 방금 만들었던 워드 워드클라우드 워드 클라우드 워드아트 생성기 만들기 사이트 단어시각화 프로그램 워드클라우드생성기 태그 워드크라우드 추천 어플 클라우드를 바탕으로 시간의 흐름에 따라 많이 언급된 토픽이 어떻게 변화하는지를 보여 주는 워드 클라우드를 만들어 보겠습니다. 집중! ▼​01 방금 만들었던 워드 클라우드에 월을 추가하겠습니다. [데이터] 패널의 [일자]를 [필터] 선반으로 드래그합니다. [필터 필드] 대화상자에서 [연도/월]을 선택하고 [다음] 버튼을 클릭합니다.​​​02 [필터] 대화상자의 목록에서 [전체] 버튼을 클릭하고 [확인] 버튼을 클릭합니다. 이러면 [필터] 선반에 [년월(일자)]가 추가됩니다.​​​03 뷰에 [년월(일자)] 필터 목록을 추가하기 위해 [필터] 선반에서 [년월(일자)]의 드롭다운 버튼을 클릭한 다음 [필터 표시]를 선택합니다.​​​04 필터 목록의 표시 형식을 조금 더 직관적인 슬라이더로 바꾸기 위해 [년월(일자)] 필터 목록의 드롭다운 버튼을 클릭해서 [단일 값(슬라이더)]를 선택합니다.​​​05 이제 굴림체에서 다른 글꼴로 바꿔보겠습니다. 워드클라우드 워드 클라우드 워드아트 생성기 만들기 사이트 단어시각화 프로그램 워드클라우드생성기 태그 워드크라우드 추천 어플 [마크] 카드의 텍스트를 클릭하고 […] 버튼을 클릭합니다.​​​06 [레이블 편집] 대화상자의 입력 칸에서 ;을 드래그해서 선택하고 글꼴 선택 드롭 박스에서 원하는 글꼴을 선택한 후 [확인] 버튼을 클릭합니다.​​​07 원하는 글꼴이 적용된 워드 클라우드가 완성됩니다.​​두 번째 질문에 이제 대답할 수 있어요!​Q2. 시간의 흐름에 따라 토픽의 빈도수에 차이가 있는가?A2. 지난 2012년 1월에는 봉투와 민주라는 토픽 단어가 가장 많이 언급되었습니다. 1월에는 봉투와 관련된 어떤 사건이 있었던 것으로 보입니다. [년월(일자)] 슬라이드를 오른쪽으로 1단계 옮겨 보겠습니다.​2012년 2월에는 민주와 공천이라는 토픽 단어가 많이 사용되었다는 사실로 미루어 봤을 때 대선을 앞두고 공천을 시작한 것으로 보입니다. 또한 그리스 라는 토픽 단어도 워드클라우드 워드 클라우드 워드아트 생성기 만들기 사이트 단어시각화 프로그램 워드클라우드생성기 태그 워드크라우드 추천 어플 보이는 것으로 미루어 봤을 때, 이 시점에 그리스 경제 문제가 시작되었음을 짐작할 수 있습니다. 다시 말해, 시간의 흐름에 따라 자주 사용되는 토픽 단어도 변했습니다.​​​마무리 요약!워드 클라우드는 언제 쓰는게 좋은가요?:- 서술형 데이터를 분석할 때 효과적입니다.- 사용 빈도수가 높은 핵심 단어를 강조할 때 유용합니다.​워드 클라우드 사용팁:- 단어가 많다면 빈도수가 낮은 단어는 제외합니다.- 별 의미가 없는 단어는 제거합니다.위 내용은 『사례 분석으로 배우는 데이터 시각화』의 일부분을 재구성하여 작성되었습니다.​워드 클라우드는 서술형 데이터를 전처리해서 가장 많이 언급된 핵심 단어를 분석할 때 유용합니다. 다양한 데이터를 바탕으로 워드 클라우드를 직접 만들어 보면서 핵심 단어를 분석하는 능력을 키워보세요!​

워드클라우드 워드 클라우드 워드아트 생성기 만들기 사이트 단어시각화 프로그램 워드클라우드생성기 태그 워드크라우드 추천 어플

댓글목록

등록된 댓글이 없습니다.

상호명 신성사 | 대표자 박한규 | 사업자등록번호 106-50-64457 | TEL 02-713 –3691 | FAX 02 - 716 - 8564 | ADD 서울특별시 용산구 원효로58길 17 나우빌딩 2층 | E-mail help@sscom.co.kr

Copyrightsⓒ2016 신성사 All rights reserved.