chap04의 목적 - 시계열 데이터 시뮬레이션 vs 다른 동류 데이터 시뮬레이션 비교 - 실제 코드 기반 시뮬레이션 예 살펴보기 - 시계열 시뮬레이션 동향 살펴보기 4.1 시계열 시뮬레이션의 특별한 점 동일한 시계열에서는 두 데이터가 서로 다른 시간에 일어나므로 정확하게 비교하는 것은 어렵다. 따라서 특정 시간에 발생 가능한 일을 예측하려면 시뮬레이션을 실행해봐야 한다. 4.1.1 시뮬레이션과 예측 시뮬레이션과 예측은 유사하나, 차이점이 있다. - 정성적 관측을 예측보다 시뮬레이션에 통합하는 것이 더 쉬울 수 있다. - 시뮬레이션은 확장 가능하므로, 예측은 시뮬레이션보다 더 신중하게 처리되어야 한다. - 시뮬레이션은 가상이므로 예측보다 위험 부담이 적다. 창의적이고 탐구적인 자세로 설계할 수 있다. 4..
데이터 사이언스 사용 설명서 검색 결과
본 논문에서는 implicit gradients를 활용한 Meta Learning을 통해 의료 이미지에 대한 segmentation에 관한 내용을 다룬다. 1. Meta Learning Medical Image Analysis 분야에서 발생하는 주요 문제는 1) 질병에 대한 annotation 작성의 어려움, 2) 피부나 위 등 다양한 기관 및 흑색종이나 용종 등 여러 질병으로 구성된 heterogeneous dataset, 3) public한 dataset의 부족과 잘못된 label이 포함된 품질적인 이슈 등이 존재한다. 이러한 문제를 해결하기 위해 Few shot Setting에서의 Meta Learning이 잠재적인 솔루션으로 부상하고 있다. Meta Learning이란 'Learning to le..
해당 논문은 Transfer-Learning을 이용하여 Chest X-ray와 CT 데이터를 분석하여 COVID-19를 진단하는 모델에 대한 연구이다. Transfer Learning 현재, 여러 딥러닝과 머신러닝 모델들이 좋은 예측 성능을 보이고 있다. 하지만, 좋은 성능을 보이기 위해서는 질 좋고, 다량의 데이터와 긴 학습시간이 소요가 된다. 이는 머신러닝과 딥러닝을 적용하는 것에 있어서 가장 큰 걸림돌이 되고 있다. 전이 학습의 주요 내용은 머신러닝 / 딥러닝에서도 사람이 학습하듯이 '다른 데이터나 task에서 학습한 내용을 현재 하고자 하는 task에 적용할 수 있는 능력'을 가지도록 할 수 있다는 것이다. 전이학습의 과정 데이터가 많은 분야의 데이터를 모델이 사전 학습(pre-train)을 진행..
OS services to User - ui : cli, gui와 같이 user interface를 제공한다. - user program execution : 프로그램을 load해서 memory에 넣고 실행한다. 끝나면 종료한다. - i/o operations : 입출력을 운영한다. - file systems manipulation : 디스크를 관리하는 역할 - communication : 프로세스가 정보를 변경하면, 네트워크를 통해 컴퓨터 사이에 정보를 주고받는다. - error detection : 말 그대로 에러를 감지한다. OS Services for resource management - resource : 하드웨어 - cpu, 메모리(시간적인 개념 - cpu로 1초에 끝나는, 10초에 끝나는)..
1. 운영체제란? operating system : operating(운영하다, 뭔가를 managing하다) + system(범위 내에서 구성워들 사이에 관계, 역할들을 규정지어 놓은 체계) => 뭔가(컴퓨터)를 운영하기 위해 고안된 시스템 운영체제는 모든 것이 코드로 되어 있는 100% software이다. ex) windows, android, ios. windows를 제외한 대부분 운영체제는 unix에서 파생되었다. 운영체제의 구조는 아래와 같다. user/developers-application-os-devices os는 전자장치가 있는 모든 디바이스에 필요하다. 하지만 못 올려서, 올라가지 못 할 수도 있다. 다시 말해 os는 효율성을 위한 프로그램으로, 하드웨어를 제어[관리, 운영]하는 프로그..
MVC(장고는 MTV) Model - 안전하게 데이터를 저장 View - 데이터를 적절하게 유저하게 보여줌 Control, Template(Django) - 사용자의 입력과 이벤트에 반응하여 Model과 View를 업데이트 옛날에는 하나의 파일 안에 모델과 데이터베이스, 디자인들이 다 합쳐져 있었음 -> 여러명이 작업할 때 불편 -> 아 프로젝트 관리가 안 되니, MVC처럼 코드를 분리하면서 해보자 해서 아래와 같은 로직이 만들어짐. Django 개념 url dispatcher : 요청한 url을 분석해서 적합한 view를 보여줌 view : 어떤 데이터를 가공할지 model과 커넥션, model->view(데이터 전송) template : view에서 받은 데이터를 js와 같은 인터페이스를 통해 Web..
이웃기반 vs 모델기반 차이 이웃기반 협업필터링이란? 메모리 기반 : 과거에 있던 데이터(user-item)를 기반으로 새로운 아이템을 예측 1) 구현이 간단 2) Model-based CF에 비해 계산량이 적음 3) 새로운 user, item이 추가되더라도 비교적 안정적 4) 새로운 content(user 또는 item)를 추천할 수 있다. 모델기반 협업필터링이란? 머신러닝(and 특징)을 가장 잘 활용한 추천알고리즘의 일종이자 주어진 데이터를 활용하여 모델을 학습한다. 항목간 유사성보단 데이터의 패턴을 학습하며 데이터(유저)의 잠재적 특성(선호하는 취향)을 파악하는 모델이다. 1) 알고리즘의 크기 : 데이터로 구성된 행렬보다 압축된 형태로 저장된다. 2) 학습과 예측 속도 : 미리모델을 준비하여, 준..
1. Introduction Neighborhood based collaborative filtering 알고리즘은 다른 말로 memory-based algorithm이라고도 불린다. 이 알고리즘은 비슷한 유저는 특정 아이템에 비슷한 평점을 준다는 아이디어에 기반한다. 이런 Neighborhood based collaborative filtering에는 두 가지 타입이 존재한다. 1.1 User-based collaborativefiltering 유저 A와 비슷한 유저들의 평점이, 유저 A 추천에 사용되는 경우다. 유저 A의 각 아이템 예측 평점은 유저 A가 속하는 동료 집단(peer)의 평점으로 계산된다. - 평점을 예측할 때 이웃 유저를 이용해서 예측(이웃 유저 = 비슷한 유저 = 평점 행렬의 행) ..
SVM이란 분류 모델로 Hyper plane이라는 선 혹은 평면이라는 기준을 가지고 분류하는 것이다. SVM은 이 Hyper plane을 구하는 것이고, 즉 w와 b를 구하는 것이 가장 중요하다. 여기서는 선형 SVM을 다루고 다음 페이지에서 비선형 SVM을 다루고자 한다. SVM에서 class를 나누는 기준은? 위 사진을 보면 두 class를 나누는 hyperplane(여기서는 직선)이 무한이 많다. 그렇다면 어떤 hyperplane이 가장 좋은 hyperplane이고, 좋다는 것의 기준은 무엇일까? 좋다는 것의 기준이자 SVM의 목표는 training data의 margin이 최대화 되는 것을 찾는 것이다. 즉 margin을 최대화 한다는 것은 일반적인 error를 최소화 한다는 것이고, 이는 좋은 ..
1. An Introduction to Recommender Systems 인터넷이 발전됨에 따라 아이템 구매 및 선호에 대한 사용자의 피드백을 얻기 쉬워졌다. 이런 피드백을 바탕으로 과거의 사용자-아이템 간 데이터를 활용해 취향을 고려한 아이템을 추천하는 것이 추천시스템의 기본적 아이디어이다. 추천 알고리즘은 대표적으로 아래와 같이 3가지가 있다. Collaborative Filtering : 협업필터링 Content-based Recommender Systems : 컨텐츠 기반 추천시스템 Knowledge-based systems : 지식 기반 추천 시스템. 1.1 Goals of Recommender Systems 추천시스템의 목적을 논하기 전에, 두 가지 추천 문제에 대해 알아보자. 1) Pred..
최근댓글