데이터 분석에 필수적인 과정 중 하나가 현재 가지고 있는 데이터 셋을 시각화 하는 작업, 그리고 특정 모델들을 사용하여 학습하거나 예측을 할 때에도 시각화는 많이 사용된다. 그 중에서도 여러개의 그래프를 동시에 나타내어 시각적으로 비교를 해야하는 경우가 빈번하게 존재한다. 그 중에서도 위의 이미지처럼 plt.subplot()을 사용하여 그래프를 사용하는 경우가 많다. plt.subplots(m , n) 여러 책이나 자료들에서 아래와 비슷한 코드들을 많이 볼 수 있다. import pandas as pd import numpy as np import matplotlib.pyplot as plt %matplotlib inline fig, axes = plt.subplots(2) 여기에서 fig는 전체 그래프..
데이터 분석 & 시각화 검색 결과
관심 영역을 지정한 후, 해당 영역을 반전시킨 부분을 이미지에 반영하는 코드이다. import cv2 import numpy as np img = cv2.imread('image.jpg') cv2.imshow('img', img) drag = False # drag 상태 defalut_x, default_y, w, h = -1,-1,-1,-1 # 좌표 blue = (255,0,0) def Mouse(event, x, y, flag, param): global drag, default_x, default_y, img # global variance if event == cv2.EVENT_LBUTTONDOWN: # 왼쪽 버튼 누름 drag = True default_x = x default_y = y eli..
import cv2 import numpy as np import matplotlib.pyplot as plt 1. Convexity Defects 이전에 Convex Hull을 통해 Contour Points를 모두 포함하는 볼록체에 대해 살펴보았다. 그러면서 cv2.isContourConvex 함수를 통해 Contour에 볼록 결함(Convexity Defect)가 있는지 살펴보기도 하였다. 이번에는 단순히 해당 이미지가 볼록한지 아닌지를 판단하는 것 뿐만 아니라 볼록 결함이 있는, 즉 오목한 지점의 위치를 찾아보자. cv2.convexHull 함수를 통해 해당 Contours에서 볼록한 부분을 찾을 수 있다. 필요한 인자로는 points로 2차원 포인터들의 집합을 입력으로 받으며 cv2.findCo..
태블로의 기본화면 태블로를 클릭하여 들어간다면 위와 같은 화면이 표시된다. 왼쪽에 짙은 파란색으로 되어 있는 부분은 데이터를 불러오는 곳이고, 중앙에 있는 부분은 내가 지금까지 했던 대시보드와 작업 파일들이다. 그리고 오른쪽은 태블로에서 자체적으로 만든 교육자료와 리소스 자료들이 있다. 왼쪽 아래 -> 저장된 데이터 원본 -> Sample- superstore를 눌러 태블로에서 기본적으로 제공해주는 샘플 데이터를 열어보도록 하자. 시트 기본화면 시트는 위와 같은 화면으로 구성되어 있다. 왼쪽은 데이터들을 테이블과 행, 열의 형태로 나타낸 것이고 중앙 시트 부분과 행, 열, 페이지, 필터, 마크 등을 변경시켜 차트를 만들 수 있다. bar차트 그리기 왼쪽 테이블의 orders를 열어보도록 하자. 왼쪽의 r..
Tableau란? 태블로는 데이터를 분석 및 시각화하는 Business Intelligence 솔루션입니다. 데이터를 활용하기 위해선 IT 부서와의 협업이 필수적이었다 보니 전통적인 BI는 업무 처리 속도 또는 데이터 해석의 정확성에서 한계가 보여, 현대적인 BI. 즉 태블로가 탄생했습니다. Tableau는 Tableau Creator, Tableau Explorer, Tableau Viewer로 나누어져 있습니다. Tableau Creator Tableau Creator는 다시 Tableau Desktop, Tableau Server/Online, Tableau Prep로 구성되어 있습니다. 먼저 Tableau Desktop은 온프레미스 또는 클라우드에 저장된 데이터 원본을 직접 연결해 분석할 수 있는..
문제1 상품의 카테고리별로 상품 수와 평균 가격대(list_price)를 찾는 쿼리를 작성하세요. 쿼리 select category, COUNT(*), avg(list_price) from products group by category; 실행화면 문제2 2006년 1분기에 고객별 주문횟수, 주문한 상품의 카테고리수, 총 주문 금액을 찾는 쿼리를 작성하세요. 쿼리 select o.customer_id, c.first_name, c.last_name , COUNT(p.category) AS `카테고리수`, SUM(od.quantity * od.unit_price) AS `총 주문 금액` from orders as o join order_details as od on o.id = od.order_id joi..
문제1 Country별로 ContactName이 'A'로 시작하는 Customer의 숫자를 세는 쿼리를 작성하세요. 쿼리 SELECT Country, COUNT(*) FROM [Customers] WHERE ContactName LIKE 'A%' GROUP BY Country; 실행화면 문제2 Customer 별로 Order한 Product의 총 Quantity를 세는 쿼리를 작성하세요. 쿼리 SELECT O.CustomerID, COUNT(OD.Quantity) FROM OrderDetails AS OD, Orders AS O WHERE OD.OrderID = O.OrderID GROUP BY CustomerID; 실행화면 문제3 년월별, Employee별로 Product를 몇 개씩 판매했는지와 그 E..
import cv2 import numpy as np import matplotlib.pyplot as plt import random Contour Hierarchy 이전에 findContours로 Contours Points와 Hierarhcy를 반환받는다고 하였다. Image에는 여러가지 Contours가 존재하고, 그 사이에는 상관관계가 존재하며, 그 관계를 Contours Hierarchy라고 한다. 이들의 상관관계를 통해서 Parent, Child 혹은 동등한 상관관계에서의 이웃을 파악할 수 있다. Contours를 찾다보면 해당 Contours가 독립적으로 존재하는 Contours일 경우도 있고 내부에 Contour가 존재하는 경우도 있다. 각각 동일한 수준에서 Contour가 존재하는 경우..
Universal functions (ufunc) — NumPy v1.15 Manual Universal functions (ufunc) A universal function (or ufunc for short) is a function that operates on ndarrays in an element-by-element fashion, supporting array broadcasting, type casting, and several other standard features. That is, a ufunc is a “vecto numpy.org Numpy에는 Universal function 기능을 제공한다. Numpy의 특별한 구조인 ndarray의 각 요소별로 연산하는 함수로 Braodca..
다음의 랭킹 뉴스 페이지는 "많이 본 순", "열독률 높은 순", "댓글 많은 순", "연령, 성별"로 정리되어 있다. 각각의 랭킹뉴스 페이지의 url은 다음과 같은 형식으로 이루어져 있다. 많이 본 순 : "https://news.daum.net/ranking/popular?regDate=" + str(date) 열독률 높은 순 : "https://news.daum.net/ranking/kkomkkom?regDate=" + str(date) 댓글 많은 순 : "https://news.daum.net/ranking/bestreply?regDate=" + str(date) 연령, 성별 : "https://news.daum.net/ranking/age?regDate=" + str(date) 기본적으로 각각의..
최근댓글