이번에는 Pycaret을 통해서 Training을 진행한 모델들의 Feature Importance를 구하는 과정에 대해서 포스팅을 해볼 예정이다. Feature Importance란 무엇인가?? Feature Importance는 기본적으로, 각 모델이 Target 값을 예측하는 과정에서 각 Feature들이 Prediction에 얼마나 큰 영향을 미쳤는지를 알려주는 지표이다. Feature Importance를 구하는 방법은 여러가지가 있는데, 가장 기본적으로 Coefficient를 구하는 방법(Linear Model & Tree Model), Permutation importance, SHAP Value가 있다. Linear Model 가장 기본적인 방법으로는 Linear Model을 생각했을 때,..
소개 및 연구분야 검색 결과
Pycaret Pycaret은 Machine Learning Workflow를 자동화하는 오픈소스 라이브러리이다. Classification, Regression, Clustering 등의 Task에서 사용하는 여러 모델들을 동일한 환경에서 한번에 한 줄의 코드로 실행할 수 있도록 자동화한 라이브러리이다. 여러 모델을 비교할 수 있으며, 각 모델 별로 튜닝을 진행할 수도 있다. (2022.07.17 현재, 가장 최근 Release는 Pycaret 2.3.10) 현재 연구 중인 분야가 Regression Task이기 때문에, Regression을 기준으로 설명한다. 여기에서는 내가 연구를 진행하면서 사용한 주요 메서드와 그 안에 입력한 파라미터들을 위주로 정리를 했으며, 추가적인 내용을 원하거나, 더욱 구..
본 논문에서는 implicit gradients를 활용한 Meta Learning을 통해 의료 이미지에 대한 segmentation에 관한 내용을 다룬다. 1. Meta Learning Medical Image Analysis 분야에서 발생하는 주요 문제는 1) 질병에 대한 annotation 작성의 어려움, 2) 피부나 위 등 다양한 기관 및 흑색종이나 용종 등 여러 질병으로 구성된 heterogeneous dataset, 3) public한 dataset의 부족과 잘못된 label이 포함된 품질적인 이슈 등이 존재한다. 이러한 문제를 해결하기 위해 Few shot Setting에서의 Meta Learning이 잠재적인 솔루션으로 부상하고 있다. Meta Learning이란 'Learning to le..
해당 논문은 Transfer-Learning을 이용하여 Chest X-ray와 CT 데이터를 분석하여 COVID-19를 진단하는 모델에 대한 연구이다. Transfer Learning 현재, 여러 딥러닝과 머신러닝 모델들이 좋은 예측 성능을 보이고 있다. 하지만, 좋은 성능을 보이기 위해서는 질 좋고, 다량의 데이터와 긴 학습시간이 소요가 된다. 이는 머신러닝과 딥러닝을 적용하는 것에 있어서 가장 큰 걸림돌이 되고 있다. 전이 학습의 주요 내용은 머신러닝 / 딥러닝에서도 사람이 학습하듯이 '다른 데이터나 task에서 학습한 내용을 현재 하고자 하는 task에 적용할 수 있는 능력'을 가지도록 할 수 있다는 것이다. 전이학습의 과정 데이터가 많은 분야의 데이터를 모델이 사전 학습(pre-train)을 진행..
최근댓글