이번에는 Pycaret을 통해서 Training을 진행한 모델들의 Feature Importance를 구하는 과정에 대해서 포스팅을 해볼 예정이다. Feature Importance란 무엇인가?? Feature Importance는 기본적으로, 각 모델이 Target 값을 예측하는 과정에서 각 Feature들이 Prediction에 얼마나 큰 영향을 미쳤는지를 알려주는 지표이다. Feature Importance를 구하는 방법은 여러가지가 있는데, 가장 기본적으로 Coefficient를 구하는 방법(Linear Model & Tree Model), Permutation importance, SHAP Value가 있다. Linear Model 가장 기본적인 방법으로는 Linear Model을 생각했을 때,..
소개 및 연구분야/한주혁 - NeuroScience 검색 결과
Pycaret Pycaret은 Machine Learning Workflow를 자동화하는 오픈소스 라이브러리이다. Classification, Regression, Clustering 등의 Task에서 사용하는 여러 모델들을 동일한 환경에서 한번에 한 줄의 코드로 실행할 수 있도록 자동화한 라이브러리이다. 여러 모델을 비교할 수 있으며, 각 모델 별로 튜닝을 진행할 수도 있다. (2022.07.17 현재, 가장 최근 Release는 Pycaret 2.3.10) 현재 연구 중인 분야가 Regression Task이기 때문에, Regression을 기준으로 설명한다. 여기에서는 내가 연구를 진행하면서 사용한 주요 메서드와 그 안에 입력한 파라미터들을 위주로 정리를 했으며, 추가적인 내용을 원하거나, 더욱 구..
해당 논문은 Transfer-Learning을 이용하여 Chest X-ray와 CT 데이터를 분석하여 COVID-19를 진단하는 모델에 대한 연구이다. Transfer Learning 현재, 여러 딥러닝과 머신러닝 모델들이 좋은 예측 성능을 보이고 있다. 하지만, 좋은 성능을 보이기 위해서는 질 좋고, 다량의 데이터와 긴 학습시간이 소요가 된다. 이는 머신러닝과 딥러닝을 적용하는 것에 있어서 가장 큰 걸림돌이 되고 있다. 전이 학습의 주요 내용은 머신러닝 / 딥러닝에서도 사람이 학습하듯이 '다른 데이터나 task에서 학습한 내용을 현재 하고자 하는 task에 적용할 수 있는 능력'을 가지도록 할 수 있다는 것이다. 전이학습의 과정 데이터가 많은 분야의 데이터를 모델이 사전 학습(pre-train)을 진행..
최근댓글