실험 DataSets 정리 1) ImageNet-1k 2) ImageNet-21k 3) JFT-3B 4) YFCC100M 5) IG-1B-Targeted Pretrained model 정리 AlexNet(2012) : ImageNet Classification with Deep Convilutional Neural Networks dataset(imageNet) preprocessing 1) 이미지 크기를 256x256으로 고정. (width와 height 중 더 짧은 쪽은 256으로 고정, 중앙 부분 256x256 crop) 2) 각 이미지의 pixel에 training set의 평균을 추출해서 normalize Architecture - 구조 : Max-pooling layer가 적용된 5개의 con..
딥러닝/컴퓨터비전 검색 결과
2차원 Convolution의 문제점 - contextual information을 확보하기 위해 넓은 Receptive field를 고려할 필요가 있음. - CNN에서는 이를 확장하기 위해 커널 크기를 키우거나 layer를 쌓는데, 이는 연산량을 매우 크게 증가시킴. -> 해당 문제점인 연산량을 경량화, 정보 손실이 일어나지 않게 유의미한 정보만을 추출하기 위해 다양한 기법이 나타남. 1. Dilated Convolutions (= astrous Conv) - 기존 Conv filter가 수용하는 pixel 사이에 간격을 둔 형태 (간격을 조절하면서 다양한 scale 대응 가능) - 입력 pixel 수는 동일하지만, 더 넓은 범위에 대한 입력 수용 - dilation rate 파라미터 : 커널 사이 간..
이 블로그는 CS231n 강의를 기반으로 정리한 내용입니다. - ConvNet의 구조엔 width * height * depth의 이미지 형태가 input으로 들어옴. - filter로 연산 진행 -> activation map 생성. 이 때 filter 개수 = activation map개수 - 연산 진행 시 (이미지 depth = filter depth) 맞춰줘야 함. - update하는 파라미터는 filter의 값들 Filter란? - Filter란 input의 정보들을 output으로 압축해주는, 혹은 정보를 전달해주는 역할. - output size 공식 : (N-F) / stride + 1 Padding의 기능 - 이미지 보존의 역할. filter를 거치면서 size가 줄어드는데, Paddin..
nicknochnack/ANPRwithPython Contribute to nicknochnack/ANPRwithPython development by creating an account on GitHub. github.com 0. Install and Import Dependencies pip install easyocr pip install imutils # OMP: ERROR #15: Initializing libiomp5md.dll, but found libiomp5md.dll already initialized. import os os.environ['KMP_DUPLICATE_LIB_OK']='True' import cv2 from matplotlib import pyplot as plt im..
JaidedAI/EasyOCR Ready-to-use OCR with 80+ supported languages and all popular writing scripts including Latin, Chinese, Arabic, Devanagari, Cyrillic and etc. - JaidedAI/EasyOCR github.com OCR (Optical Character Reader/Recognition) 광학식 문자 판독기의 줄임말로 필기체 혹은 인쇄된 글자를 인식하여 텍스트 데이터로 치환하는 기술을 말한다. 필기체보다는 주로 활자로 된 문서를 인식하고 사용자가 지정한 영역의 텍스트와 데이터를 추출하는데 많이 사용한다. 삼성페이, 카카오페이 등에 카드를 등록할 때 일일이 손으로 입력할 필요 없이 ..
최근댓글