Python 언어를 활용하다 보면 Jupyter Lab 혹은 Jupyter Notebook을 많이 사용한다. 하지만, 가끔 아나콘다에서 가상 환경을 생성하여 이를 Kernel로 활용하는 것이 제대로 동작하지 않는 경우가 있다. 다시 말해서, 분명히 해당 가상 환경에서 어떤 패키지를 설치했음에도 불구하고, Import Error가 뜨는 경우이다. 일단 첫번째로, 아나콘다 프롬프트에서 conda activate [가상환경] 으로 사용하고자 하는 가상 환경에 진입한다. 그 이후에, 해당 가상 환경에 설치된 패키지들에 대한 정보를 확인할 수 있는 conda list 를 통해서 확인해본다. 이제, Jupyter Lab 혹은 Jupyter Notebook에서 설치하였지만, 제대로 설치가 되어 있지 않은 패키지를 i..
python 검색 결과
데이터 분석에 필수적인 과정 중 하나가 현재 가지고 있는 데이터 셋을 시각화 하는 작업, 그리고 특정 모델들을 사용하여 학습하거나 예측을 할 때에도 시각화는 많이 사용된다. 그 중에서도 여러개의 그래프를 동시에 나타내어 시각적으로 비교를 해야하는 경우가 빈번하게 존재한다. 그 중에서도 위의 이미지처럼 plt.subplot()을 사용하여 그래프를 사용하는 경우가 많다. plt.subplots(m , n) 여러 책이나 자료들에서 아래와 비슷한 코드들을 많이 볼 수 있다. import pandas as pd import numpy as np import matplotlib.pyplot as plt %matplotlib inline fig, axes = plt.subplots(2) 여기에서 fig는 전체 그래프..
import cv2 import numpy as np import matplotlib.pyplot as plt 1. Convexity Defects 이전에 Convex Hull을 통해 Contour Points를 모두 포함하는 볼록체에 대해 살펴보았다. 그러면서 cv2.isContourConvex 함수를 통해 Contour에 볼록 결함(Convexity Defect)가 있는지 살펴보기도 하였다. 이번에는 단순히 해당 이미지가 볼록한지 아닌지를 판단하는 것 뿐만 아니라 볼록 결함이 있는, 즉 오목한 지점의 위치를 찾아보자. cv2.convexHull 함수를 통해 해당 Contours에서 볼록한 부분을 찾을 수 있다. 필요한 인자로는 points로 2차원 포인터들의 집합을 입력으로 받으며 cv2.findCo..
localhost:8888 내용: [autopep8] Error loading library for python: ModuleNotFoundErrorNo module named 'autopep8' Check that the appropriate library/module is correctly installed (read autopep8's documentation for deltails) 오류에 대한 원인 : 라는 책을 따라서 실습을 하던 도중, 환경 설정을 위해서, git으로부터 .yml(환경을 설정해주는 파일)을 다운 받고, 해당 .yml 파일을 실행시켜 가상환경을 만들고 해당 라이브러리들을 설치했다. 해당 파일들을 읽는 것에서는 문제가 없었지만, 실습을 해보기 위해서, 새로운 파일을 생성했을 때에..
JaidedAI/EasyOCR Ready-to-use OCR with 80+ supported languages and all popular writing scripts including Latin, Chinese, Arabic, Devanagari, Cyrillic and etc. - JaidedAI/EasyOCR github.com OCR (Optical Character Reader/Recognition) 광학식 문자 판독기의 줄임말로 필기체 혹은 인쇄된 글자를 인식하여 텍스트 데이터로 치환하는 기술을 말한다. 필기체보다는 주로 활자로 된 문서를 인식하고 사용자가 지정한 영역의 텍스트와 데이터를 추출하는데 많이 사용한다. 삼성페이, 카카오페이 등에 카드를 등록할 때 일일이 손으로 입력할 필요 없이 ..
subplot은 각각 칸을 나누어서 해당하는 부분에 내가 원하는 그래프를 넣을 수 있는 방법이다. 하지만, 데이터 분석에서 시각화를 하는 입장에서는 두 그래프를 한곳에 두고 비교를 하고 싶은 경우 겨쳐 그리고 싶은 경우가 종종 있다. 이런 경우에는 생각보다 간단하게 코드로 구현할 수 있다. import matplotlib.pyplot as plt plt.plot(x_1, y_1, x_2, y_2) plt.show() 위와 같이 그래프 1에 대한 x와 y에 대한 정보를 입력하고, 바로 뒤에 별도의 parameter를 지정할 필요 없이, 순서대로 입력을 해주면 된다. 2개의 직선 뿐만 아니라 더 많은 그래프를 한 곳에 겹쳐 그리는 경우에도 위와 같은 방식으로 뒤에 계속해서 이어 붙이면 겹쳐 그려지는 것을 확..
import cv2 import numpy as np import matplotlib.pyplot as plt import random Contour Hierarchy 이전에 findContours로 Contours Points와 Hierarhcy를 반환받는다고 하였다. Image에는 여러가지 Contours가 존재하고, 그 사이에는 상관관계가 존재하며, 그 관계를 Contours Hierarchy라고 한다. 이들의 상관관계를 통해서 Parent, Child 혹은 동등한 상관관계에서의 이웃을 파악할 수 있다. Contours를 찾다보면 해당 Contours가 독립적으로 존재하는 Contours일 경우도 있고 내부에 Contour가 존재하는 경우도 있다. 각각 동일한 수준에서 Contour가 존재하는 경우..
Universal functions (ufunc) — NumPy v1.15 Manual Universal functions (ufunc) A universal function (or ufunc for short) is a function that operates on ndarrays in an element-by-element fashion, supporting array broadcasting, type casting, and several other standard features. That is, a ufunc is a “vecto numpy.org Numpy에는 Universal function 기능을 제공한다. Numpy의 특별한 구조인 ndarray의 각 요소별로 연산하는 함수로 Braodca..
다음의 랭킹 뉴스 페이지는 "많이 본 순", "열독률 높은 순", "댓글 많은 순", "연령, 성별"로 정리되어 있다. 각각의 랭킹뉴스 페이지의 url은 다음과 같은 형식으로 이루어져 있다. 많이 본 순 : "https://news.daum.net/ranking/popular?regDate=" + str(date) 열독률 높은 순 : "https://news.daum.net/ranking/kkomkkom?regDate=" + str(date) 댓글 많은 순 : "https://news.daum.net/ranking/bestreply?regDate=" + str(date) 연령, 성별 : "https://news.daum.net/ranking/age?regDate=" + str(date) 기본적으로 각각의..
크롤링 (5), beautifulsoup4로 네이버 기사 크롤링하기 네이버 랭킹 뉴스 페이지가 개편되어 해당 코드로 기사를 가져올 수 없습니다. 해당 코드는 참고용으로만 봐주시기 바랍니다. (JY) 융합연구 1 - 크롤링 (4), beautifulsoup4로 네이버 기사 크롤링하기 dsbook.tistory.com 네이버 랭킹 뉴스만 볼 수 있던 페이지가 전면적으로 개편되면서 위 게시글에서 작성한 코드를 사용했을 때 뉴스를 가져올 수 없었다. 그래서 이번에 개편된 랭킹 뉴스 페이지를 기반으로 새롭게 크롤링하는 코드를 작성해보았다. 랭킹 뉴스 페이지에서 이전처럼 정치, 경제, 사회, 과학 등 분야별로 따로 나누어서 게시글을 찾아볼 수 없었다. 대신 각 언론사별로 많이 본 뉴스와 댓글이 많은 뉴스를 나누어서..
최근댓글