퍼셉트론이란? 퍼셉트론은 프랑크 로젠블라트가 1957년에 고안한 알고리즘으로 딥러닝(신경망)의 기원이 되는 알고리즘이다. 미분적분학을 하기 전에 사칙연산을 하는 것처럼, 딥러닝을 배우기 위해서는 퍼셉트론의 구조를 배우는 것이 매우 중요한 일이기 기 때문에 익혀둬야 한다. 퍼셉트론이란 위 사진처럼 신호(x1, x2)를 입력받아 하나의 신호(y)를 출력하는 것을 말합니다. 그림에 있는 원들을 뉴런 또는 노드라고 부르며, 입력 신호가 뉴런에 보내질 때는 각각 고유한 가중치(w1, w2)가 곱해집니다. 뉴런에서 보내온 신호의 총합이 정해진 한계를 넘어설 때만 1(흐른다)를 출력하고, 이를 '뉴런이 활성화한다'라고 표현하기도 합니다. 그리고 이 한계를 임계값이라고 부르며 θ라는 기호로 나타냅니다. 위의 그림은 퍼..
데이터 사이언스 사용 설명서 검색 결과
SQL이란? Structured Query Language의 줄임말로, 관계형 데이터베이스 시스템(RDBMS)에서 자료를 관리 및 처리하기 위해 설계된 언어입니다. 1970년대 IBM에서 최초 개발되었으며 데이터를 저장하는 모든 회사에서 NoSQL과 함께 많이 쓰고 있습니다. SQL 문법의 종류 SQL 문법은 크게 DDL, DML, DCL로 나누어집니다. DDL(Data Definition Language, 데이터 정의 언어) - 관계형 데이터베이스의 구조를 정의하기 위해 사용하는 언어(ex - CREATE, ALTER, DROP...) DML(Data Manipulation Language, 데이터 조작 언어) - 테이브렝서 데이터를 입력, 수정, 삭제, 조회하는 언어(SELECT, INSERT, UP..
여러 디렉토리에서 원격 저장소 공유하기 프로그래밍 작업을 하는 경우 1명이 하는 경우보다 여러명이서 다같이 작업을 공동을 진행하는 경우가 많고, 1인 프로젝트라고 하더라도 작업하는 컴퓨터가 1대보다 많은 경우도 종종 있다.(예를 들어 집 컴퓨터와 회사 컴퓨터 등) 이런 경우에 GitHub에서는 이런 협업 관리를 어떻게 해주는지에 관해 알아보자. 일단 지역 저장소에서 작업을 하기 위해서는 원격 저장소에 저장되어 있는 파일들을 가져와야 한다. 여기에서는 이전에 만들었던 GitHub의 test-1이라는 repository를 사용할 것이다. 초록색으로 Code라고 쓰여진 버튼을 클릭하면 clone이라는 항목에 HTTPS 에 들어가서 해당 주소를 복사할 수 있다. git bash로 들어와 홈 디렉토리에서 git_..
SSH 원격 접속 SSH란? Secure Shell의 줄임말이다. 공개키(Public Key)와 비밀키(Private Key)를 사용하여, 더 안전하고 등록한 기기에서 작업을 한 후 번거로운 로그인 과정을 생략할 수 있는 방법이다. 일단 git bash에서 홈 디렉토리로 이동한다. 그 후 공개키와 비밀키를 만드는 명령어인 ssh-keygen을 입력한다. $ cd ~ $ ssh-keygen 명령어를 입력하면 아래의 이미지와 같은 결과를 출력한다. 이 때 별도의 입력 없이 Enter를 2번 누른다. 이후에도 "Enter passphrase" 등의 설정을 하는 부분이 나타나는데 이것 또한 별도의 입력없이 Enter를 2번 누르면 공개키와 비밀키가 생성된다. 생성된 키가 존재하고 있는 위치는 이미지에서 빨간색 ..
Data Frame은 다변량 데이터 분석에서 주로 사용되는 list형의 데이터 구조다. 1. Data Frame 생성 col1 % filter(age == 50 & (period > 150 | term > 2)) data에서 age가 50이면서 period가 150보다 크거나 term이 2보다 큰 것만 추출한 것이다. 3) arrange() : 정렬 data %>% arrange(disease) data %>% arrange(desc(disease)) 정렬할 기준 변수에 따라 오른차순, 내림차순으로 정렬할 수 있다. 4) mutate() : 파생변수 추가 data %>% mutate(churn_mutate = ifelse(data$activity % head(data..
이전까지 Git Bash 프로그램을 통해서 파일을 생성하고 저장했던 것을 본인의 컴퓨터에 저장하는 것이므로, '지역 저장소'라고 표현한다. 하지만, 컴퓨터에서 파일이 삭제되는 경우를 대비해, 많은 개발자들은 지역 저장소에 파일을 저장할 뿐 아니라 다른 공간에 자신의 작업물을 저장한다. 이 저장 공간을 '원격 저장소'라고 한다. 이 원격 저장소 중 하나가 우리가 많이 들어본 Git Hub이다. 정확하게, '원격 저장소'는 지역 저장소가 아닌 컴퓨터나 서버에 만든 저장소를 의미한다. 이전에는 이런 원격 저장소도 각 회사마다 각자의 버전 관리 시스템을 만들어서 저장했지만, 2008년 2월에 출시된 이후 사용자가 점점 늘어나고 있다. GitHub를 이용하는 이유 - 깃을 사용하지 않더라도 상대적으로 편리한 GU..
이번 포스팅에서는 이전에 배웠던 브랜치와 reset 명령어를 이용하는 방법과, 다른 작업 파일을 우선적으로 작업을 해야하는 경우 기존에 작업중이던 파일들을 임시 저장소에 저장하는 stash 명령어에 관해서 이야기 할 것이다. 브랜치와 git reset 이는 특정 브랜치가 필요에 의해서 이동하는 것을 reset 명령어를 통해서 굉장히 자유롭게 행할 수 있다. 일단 test라는 새로운 깃 저장소를 만들고, 그 안에서 master_1.txt파일을 만들어 1을 입력하고 커밋 메세지 "one"으로 커밋한다. 이후, 새로운 sub라는 이름의 브랜치를 생성한 다음, 마스터 브랜치에서 master_2.txt 파일에 2를 입력하여 커밋 메세지 "two"로 커밋한다. HEAD를 sub 브랜치로 옮긴 뒤에 sub.txt 파..
저번에 이야기 했던 대로 이번 포스팅에서는 브랜치의 정보를 확인하는 방법, 병합하는 방법에 대해서 포스팅을 할 예정이다. 브랜치 정보 확인하기 만약 git bash를 저번 포스팅 이후 껐다가 다시 켠 것이라면, 일단 manual 디렉토리로 들어가서 git branch를 이용해서 확인을 해보고, apple로 현재 HEAD가 가리키고 있는 것을 바꾸자. (저번 포스팅 이후 별다른 변화 없이 했다면 아마 ms를 가리키고 있을 것이다. ) $ cd manual $ git branch $ git checkout apple work.txt에 'apple content 4'를 추가 입력하여 저장하고, 새로운 텍스트 파일 apple.txt를 vim을 이용해서 생성한다. 이때 안의 내용은 마찬가지로 'apple cont..
1차원 ndarray Numpy의 기본 자료형 ndarray의 기본적인 인덱싱과 슬라이싱은 List 객체와 동일하다. x1 = np.array([ 1, 3, 5, 7, 9]) x1[0] # 1 x1[3] # 7 x1[-1] # 9 x1[-2] # 7 x1[1:3] # [3, 5] 2차원 ndarray 2차원 리스트 배열에서의 indexing은 x[i][j] 형태로 가능한 것처럼, 2차원 ndarray 배열에서의 indexing은 x[i, j] 형태로 가능하다. 이때 i는 행, j는 열을 의미한다. 먼저 np.random.random로 (10, 5) 크기의 ndarray를 생성한다. x2 = np.random.random(size = (10, 5)) x2 기본적으로 ndarray 객체를 인덱싱을 할 경우,..
이번 포스팅에서는 브랜치가 무엇이고 왜 필요한 지에 대해서 얘기해 볼 것이다. 그리고 git에서 브랜치를 따는 방법에 대해서도 얘기해보자. 브랜치란 무엇인가? 현실적으로 비슷한 종류의 작업을 여러개하는 경우, 두번째부터는 처음부터 작업을 진행하는 것이 아니라, 첫번째 작업에서 두번째 작업과 차이가 나는 부분에 대해서만 수정을 하여 효율적으로 진행할 수 있다. 깃뿐만이 아닌 모든 버전 관리 시스템에서 이런 것을 관리하고 사용자가 편리하게 이용하도록 브랜치라는 기능을 사용한다. 일반적으로 이전 포스팅까지 이전에 우리가 커밋을 하면서 버전 관리를 했던것을 마스터(master) 브랜치라고 부른다. 여기에서 다른 작업을 하기 위해서 브랜치를 만드는 것을 '분기(branch) 한다.' 라고 표현을 한다. (실제적으..
최근댓글