'딥러닝/컴퓨터비전' 카테고리의 글 목록

[Computer Vision] Pre-trained Models 정리

실험 DataSets 정리 1) ImageNet-1k 2) ImageNet-21k 3) JFT-3B 4) YFCC100M 5) IG-1B-Targeted Pretrained model 정리 AlexNet(2012) : ImageNet Classification with Deep Convilutional Neural Networks dataset(imageNet) preprocessing 1) 이미지 크기를 256x256으로 고정. (width와 height 중 더 짧은 쪽은 256으로 고정, 중앙 부분 256x256 crop) 2) 각 이미지의 pixel에 training set의 평균을 추출해서 normalize Architecture - 구조 : Max-pooling layer가 적용된 5개의 con..

딥러닝/컴퓨터비전 2023. 1. 19. 17:42

[Computer Vision] Basic Convolution Method

2차원 Convolution의 문제점 - contextual information을 확보하기 위해 넓은 Receptive field를 고려할 필요가 있음. - CNN에서는 이를 확장하기 위해 커널 크기를 키우거나 layer를 쌓는데, 이는 연산량을 매우 크게 증가시킴. -> 해당 문제점인 연산량을 경량화, 정보 손실이 일어나지 않게 유의미한 정보만을 추출하기 위해 다양한 기법이 나타남. 1. Dilated Convolutions (= astrous Conv) - 기존 Conv filter가 수용하는 pixel 사이에 간격을 둔 형태 (간격을 조절하면서 다양한 scale 대응 가능) - 입력 pixel 수는 동일하지만, 더 넓은 범위에 대한 입력 수용 - dilation rate 파라미터 : 커널 사이 간..

딥러닝/컴퓨터비전 2023. 1. 19. 14:14

[Computer Vision] CNN 정리

이 블로그는 CS231n 강의를 기반으로 정리한 내용입니다. - ConvNet의 구조엔 width * height * depth의 이미지 형태가 input으로 들어옴. - filter로 연산 진행 -> activation map 생성. 이 때 filter 개수 = activation map개수 - 연산 진행 시 (이미지 depth = filter depth) 맞춰줘야 함. - update하는 파라미터는 filter의 값들 Filter란? - Filter란 input의 정보들을 output으로 압축해주는, 혹은 정보를 전달해주는 역할. - output size 공식 : (N-F) / stride + 1 Padding의 기능 - 이미지 보존의 역할. filter를 거치면서 size가 줄어드는데, Paddin..

딥러닝/컴퓨터비전 2023. 1. 19. 13:31

Easy OCR 간단하게 사용해보기

nicknochnack/ANPRwithPython Contribute to nicknochnack/ANPRwithPython development by creating an account on GitHub. github.com 0. Install and Import Dependencies pip install easyocr pip install imutils # OMP: ERROR #15: Initializing libiomp5md.dll, but found libiomp5md.dll already initialized. import os os.environ['KMP_DUPLICATE_LIB_OK']='True' import cv2 from matplotlib import pyplot as plt im..

딥러닝/컴퓨터비전 2021. 3. 31. 12:36

Easy OCR 라이브러리

JaidedAI/EasyOCR Ready-to-use OCR with 80+ supported languages and all popular writing scripts including Latin, Chinese, Arabic, Devanagari, Cyrillic and etc. - JaidedAI/EasyOCR github.com OCR (Optical Character Reader/Recognition) 광학식 문자 판독기의 줄임말로 필기체 혹은 인쇄된 글자를 인식하여 텍스트 데이터로 치환하는 기술을 말한다. 필기체보다는 주로 활자로 된 문서를 인식하고 사용자가 지정한 영역의 텍스트와 데이터를 추출하는데 많이 사용한다. 삼성페이, 카카오페이 등에 카드를 등록할 때 일일이 손으로 입력할 필요 없이 ..

딥러닝/컴퓨터비전 2021. 3. 14. 21:32

내 블로그 - 관리자 홈 전환	`Q` `Q`
새 글 쓰기	`W` `W`

글 수정 (권한 있는 경우)	`E` `E`
댓글 영역으로 이동	`C` `C`

이 페이지의 URL 복사	`S` `S`
맨 위로 이동	`T` `T`
티스토리 홈 이동	`H` `H`
단축키 안내	`Shift` + `/` `⇧` + `/`

딥러닝/컴퓨터비전 검색 결과

태그

티스토리툴바

단축키

내 블로그

블로그 게시글

모든 영역

검색

CATEGORY

RECENTLY

최근 글

최근댓글

태그

VISITOR

티스토리툴바

단축키

내 블로그

블로그 게시글

모든 영역