Statistical analysis(통계적 분석)은 데이터 셋의 변수가 서로 어떤 연관이 있는지 그리고 다른 변수에 어떻게 영향을 받는지 이해하는 과정이다. 이 과정에서 시각화는 핵심 요소가 될 수 있다. 왜냐하면 시각화를 잘 했다면 한눈에 두 변수에 따른 변화,패턴을 쉽게 찾을 수 있기 때문이다. 이 글에서는 변수간의 상관관계를 찾기 위해 시각화 라이브러리 중 하나인 Seaborn의 relplot(), scatterplot(), lineplot() 3가지 함수를 다룰 것이다. scatterplot()는 산점도를 lineplot()은 선 그래프를 그려준다. relplot()은 쉽게 설명하면 scatterplot(), lineplot()의 상위 개념 즉 두 함수를 모두 포함하고 있다고 생각하면 된다. 일..
데이터 사이언스 메뉴얼/data visualization 검색 결과
heatmap 이란? heatmap은 열을 의미하는 heat와 지도를 뜻하는 map을 합친 단어이다. 데이터들의 배열 을 색상으로 표현해주는 그래프이다. 왜 heatmap을 사용하는가 - heatmap을 사용하면 두 개의 카테고리 값에 대한 값 변화를 한눈에 알기 쉽다. - 대용량 데이터도 heatmap을 이용해 시각화 한다면 이미지 몇장으로 표현이 가능하다. heatmap 만들기 먼저 필요한 모듈과 라이브러리들을 import 해주었다. heatmap을 그리기위해 seaborn에 내장되어 있는 flights 데이터셋을 불러왔다. flights 데이터 셋은 1949~1960년간 월별 승객수를 담고 있다. 현재 데이터가 heatmap을 그리기에는 적합하지 않으므로 다음과 같이 데이터 셋을 바꿔주었다, 빨간색..
지난 글에 이어 이번에는 matplotlib에 있는 여러 시각화 모델 중 대표적인 것 몇 개를 간단 하게 알려주려고 한다. 각 모델에 대해 더 자세히 공부해 보고 싶다면 각 모델 시작 마다 웹 사이트 링크가 달려있으니 웹사이트를 참조하면 된다. Bar_chart(막대그래프) - https://matplotlib.org/3.2.1/api/_as_gen/matplotlib.pyplot.bar.html 막대그래프의 장점은 크고 작음을 한눈에 이해할 수 있다는 것이다. 주로 공시적 자료를 다룰 때 자주 쓰인다. 1)막대그래프 생성하기 - plt.bar(x,y,기타설정들) 똑같이 연도별 messi의 골수를 막대그래프로 나타내 보자 작성 형식은 다음과 같다. 기본적인 형태로 막대그래프를 그려봤다. y축 label들..
Matplotlib에 대하여 Matplotlib란 Matplotlib는 Python에서 데이터들을 시각화해주는 라이브러리이다. matplotlib는 사실 다른 시각화 라이브러리들에 비해 시각적인 부분에서 뛰어나다고는 할 수 없다. 하지만 matplotlib는 적당한 수준의 시각화를 간단하게 할 수 있기 때문에 가장 대중적인 시각화 라이브러리이다. Python에서 사용되기 때문에 그때그때마다 그래프를 수정해줄 수 있다는 장점이 있다. Maplotlib 설치하기 먼저 matplotleb를 설치를 해야한다. matplotlib의 설치 방법은 다음과 같다. Python을 깔고 cmd 창에 아래 코드를 치면 설치가 된다. pip install matplolib 시작하기에 앞서.. matplotlib에는 수많은 종..
최근댓글