. 안녕하세요 저는 브라이틱스 서포터즈 3기 이상민입니다 :) 저번 포스팅에는 개인 프로젝트인 제주도 도로 교통량예측 데이터 EDA를 진행했는데요. 이번 포스팅은 Baseline Model(기준 모델)을 구현하며 분석의 기준점을 세우고 추가적인 실험을 진행하여 성능을 높이고자 합니다. 왜 feature engineering이 아닌 Baseline model부터 만드나요?? 기본적으로 데이터분석을 진행하신 분들은 궁금증을 가지실 수 있습니다. 출처 : https://www.heavy.ai/technical-glossary/feature-engineering 맞습니다! 기본적인 분석 과정은 데이터 수집 -> EDA -> Feature engineering(변수 생성&조합) -> Modeling -..
브라이틱스AI 검색 결과
안녕하세요 저는 브라이틱스 서포터즈 3기 이상민입니다 :) 저번 포스팅에는 개인 프로젝트 소개를 간단히 하였는데요. 이번 포스팅은 EDA(데이터 탐색)를 진행하며 데이터에 대해 본격적으로 분석을 진행하려고 합니다. 데이터 탐색 제주 테크노파크 제주도 도로 교통량 예측 앞선 주제는 제주도 도로 교통량 예측이었는데요. 먼저 다운받은 데이터를 브라이틱스의 Load Data 함수를 통해 불러와줍니다. 위와 같이 데이터를 불러와줬습니다! 그 후 변수에 대해 차근차근 살펴봤는데요. 문자로 되어있으면 문자, 숫자로 되어있으면 숫자 이렇게 분류하는 것보다는 datetime(시간), categorical(명목형 변수), numerical(수치형 변수), position(위치) 이렇게 변수를 타입에 따라..
안녕하세요 저번 개인 프로젝트 소개에 이어 다시 돌아온 브라이틱스 서포터즈 3기 이상민입니다. 먼저 주제를 바꿔 죄송하다는 점을 말씀 드리고 싶고, 다른 주제를 진행하게 되어 양해를 구합니다 ㅠㅠ 저번에 제가 설정한 주제는 카도소비 데이터를 활용한 고객 세분화 및 재구매주기 예측인데요. 카드 데이터를 확보함에 있어서 개인의 인적정보를 활용하여 침해할 수 있기에 카드 데이터는 공공연하게 쓸 수 없을 것 같습니다. 이에 따라 개인의 정보를 침해하지 않는 선에서 진행할 수 있는 주제를 다시 정해보았는데요. 그럼 주제를 다시 알아보러 가볼까요? 주제 소개 제주 테크노파크 제주도 도로 교통량 예측 해당 주제는 데이콘에서 진행중인데요. 요즘 자동차의 이용량이 많아지고, 관광객들의 증가로 제주도의 ..
최근댓글