안녕하세요 저는 브라이틱스 서포터즈 3기 이상민입니다 :) 벌써 브라이틱스 서포터즈 활동을 마치는 날이 다가왔는데요. 이번 포스팅을 마지막으로 브라이틱스 서포터즈와 관련된 포스팅은 마치려고 합니다. 지금까지 느꼈던 것들과 서포터즈 활동을 되돌아보며 들었던 주관적인 감정들에 대해 남겨보도록 하겠습니다 :) 브라이틱스를 처음 접해보며 서포터즈를 활동하면서 브라이틱스 스튜디오라는 분석 툴을 처음 접해보았는데요. 데이터분석을 꿈꾸는 많은 분들은 python인 R을 주로 사용하셨을 겁니다. 저또한 다른 언어를 주로 활용했었는데요. 브라이틱스를 접해보면서 자동화되어있는 모델링 과정이나 강력한 데이터분석 내장함수들이 매우 매력적으로 다가왔습니다. 다른 언어들은 코딩을 직접해야하고 분석가가 직..
삼성SDS 검색 결과
안녕하세요 저는 브라이틱스 서포터즈 3기 이상민입니다 :) 저번 포스팅에는 변수 생성에 대해 간단히 설명 하였는데요. 이번 포스팅은 Modeling의 전 과정을 EDA부터 변수 생성까지 모두 압축해서 설명하겠습니다! 데이터 탐색 제주 테크노파크 제주도 도로 교통량 예측 앞선 주제는 제주도 도로 교통량 예측이었는데요. 먼저 다운받은 데이터를 브라이틱스의 Load Data 함수를 통해 불러와줍니다. 위와 같이 데이터를 불러와줬습니다! 그리고 위와 같은 여러 변수들이 있었습니다. 저는 target변수인 평균속도에 영향을 줄만한 변수들을 살펴보았는데요. 먼저 통계지표를 뽑아보며 0이나 이상치 값들이 있는 것을 볼 수 있습니다. 그 다음은 target(평균속도)인데요. 50정도에서 높은 ..
안녕하세요!! 브라이틱스 서포터즈 3기 이상민입니다. 요즘 대학원 진학과 취업 준비로 인해 하루가 48시간이었으면 좋겠다는 생각을 잠깐씩 하는데요.. 이에 굴하지 않고 이번 브라이틱스 프로젝트 포스팅도 열심히 작성해보겠습니다! 저번 포스팅은 baseline model을 구성했는데요. xgboosting model을 기본 model로 삼아 dacon에 제출하고 6.44라는 score를 도출했었습니다. 이번 포스팅은 머신러닝 모델의 가장 중요한 Feature engineering에 대해 알아보겠습니다. 먼저 data scientists들이 분석을 진행함에 있어서 데이터 전처리에 80이상의 시간을 사용하는데요. 이에 따라 데이터를 model에 적합하게 만들고 유의미한 변수를 창출해서 성능을 ..
. 안녕하세요 저는 브라이틱스 서포터즈 3기 이상민입니다 :) 저번 포스팅에는 개인 프로젝트인 제주도 도로 교통량예측 데이터 EDA를 진행했는데요. 이번 포스팅은 Baseline Model(기준 모델)을 구현하며 분석의 기준점을 세우고 추가적인 실험을 진행하여 성능을 높이고자 합니다. 왜 feature engineering이 아닌 Baseline model부터 만드나요?? 기본적으로 데이터분석을 진행하신 분들은 궁금증을 가지실 수 있습니다. 출처 : https://www.heavy.ai/technical-glossary/feature-engineering 맞습니다! 기본적인 분석 과정은 데이터 수집 -> EDA -> Feature engineering(변수 생성&조합) -> Modeling -..
안녕하세요 저는 브라이틱스 서포터즈 3기 이상민입니다 :) 저번 포스팅에는 개인 프로젝트 소개를 간단히 하였는데요. 이번 포스팅은 EDA(데이터 탐색)를 진행하며 데이터에 대해 본격적으로 분석을 진행하려고 합니다. 데이터 탐색 제주 테크노파크 제주도 도로 교통량 예측 앞선 주제는 제주도 도로 교통량 예측이었는데요. 먼저 다운받은 데이터를 브라이틱스의 Load Data 함수를 통해 불러와줍니다. 위와 같이 데이터를 불러와줬습니다! 그 후 변수에 대해 차근차근 살펴봤는데요. 문자로 되어있으면 문자, 숫자로 되어있으면 숫자 이렇게 분류하는 것보다는 datetime(시간), categorical(명목형 변수), numerical(수치형 변수), position(위치) 이렇게 변수를 타입에 따라..
안녕하세요 저번 개인 프로젝트 소개에 이어 다시 돌아온 브라이틱스 서포터즈 3기 이상민입니다. 먼저 주제를 바꿔 죄송하다는 점을 말씀 드리고 싶고, 다른 주제를 진행하게 되어 양해를 구합니다 ㅠㅠ 저번에 제가 설정한 주제는 카도소비 데이터를 활용한 고객 세분화 및 재구매주기 예측인데요. 카드 데이터를 확보함에 있어서 개인의 인적정보를 활용하여 침해할 수 있기에 카드 데이터는 공공연하게 쓸 수 없을 것 같습니다. 이에 따라 개인의 정보를 침해하지 않는 선에서 진행할 수 있는 주제를 다시 정해보았는데요. 그럼 주제를 다시 알아보러 가볼까요? 주제 소개 제주 테크노파크 제주도 도로 교통량 예측 해당 주제는 데이콘에서 진행중인데요. 요즘 자동차의 이용량이 많아지고, 관광객들의 증가로 제주도의 ..
안녕하세요 저번 팀 영상 제작에 이어 다시 돌아온 브라이틱스 서포터즈 3기 이상민입니다. 다들 영상은 잘 보고 오셨나요? 제 발연기가 너무 부끄럽네요.. 이번 포스팅은 개인 프로젝트인데요. 공공데이터를 활용해 브라이틱스로 분석을 진행하는 것입니다! 그럼 제가 선정한 주제와 데이터에 대해 알아보러 갈까요? 주제 소개 "카드소비 데이터를 활용한 고객 세분화 및 재구매주기 예측" 출처 : https://realestate.daum.net/news/detail/hotissue/1087461/20161104143603165 big blur, 산업 간 경계가 허물어지면 다양한 유형의 데이터들이 유기적으로 연결되어 활용되고 있는데요. 특히 개인의 개성과 선호도가 뚜렷해져 고객을 세분화시켜 서비스를 제안..
안녕하세요 :) 저번주 Brightics 서포터즈 팀 미션인 홍보 영상 촬영 현장 두 번째 포스팅에 이어, 마지막 포스팅을 이어서 작성하였습니다. 저는 브라이틱스 서포터즈 3기, 3조의 이상민으로 총 5명의 팀원으로 구성되어있습니다. 저희 팀의 영상 주제는 MBTI 과몰입 소개팅 with 브라이틱스를 통한 MBTI 예측 였는데요. 저번주 촬영을 마치고 영상을 제작하면서 이번 포스팅은 후기와 느낀점을 주로 작성할 예정입니다! 저번 포스팅에는 촬영 현장을 소개했는데요. 이번 영상을 촬영하면서 정말 많은 회의를 거친 것 같습니다. 공식 회의만 8번?? + 비공식 a.. 8월 달에는 영상을 촬영하기 위한 계획을 주로 수립하고 처음에는 정말 어색했지만 MBTI 얘기하면서 친해졌습니다.. 9월..
안녕하세요 :) 저번주 Brightics 서포터즈 팀 미션인 홍보 영상 제작기 첫 번째 포스팅에 이어, 두 번째 포스팅을 이어서 작성하였습니다. 저는 브라이틱스 서포터즈 3기, 3조의 이상민으로 총 5명의 팀원으로 구성되어있습니다. 저희 팀의 영상 주제는 MBTI 과몰입 소개팅 with 브라이틱스를 통한 MBTI 예측 였는데요. 이 주제를 가지고 이번 주는 대본을 구성하고 직접 촬영까지 했습니다! 17일 토요일 오후 2시에 신촌역에서 모여서 촬영을 진행했는데요. 촬영은 수현이의 오피스텔 건물에서 촬영했습니다. 오피스텔 굉장히 좋더라고요 대본은 총 4개의 시나리오로 구성했는데요. 간단하게 설명드리자면 첫 번째는 MBTI 과몰입에 빠진 한 사람이 소개팅 상대를 찾기 위해 회사에 문의하는 상..
안녕하세요 :) 저번주에 머신러닝/딥러닝 모델로 MBTI분류하기에 이어 1주만에 다시 돌아온 브라이티스 서포터즈 3기 이상민입니다. 이번주는 지금까지 진행한 팀프로젝트를 총집합하여 정리하였습니다. 어떻게 브라이틱스로 MBTI를 예측하고 분석했는지 한 번 알아보러 갈까요?? 저희팀은 3~4주동안 MBTI예측하기 프로젝트를 진행했는데요. 엠브레인 통계조사에서 MBTI에 대한 관심도는 무려 76.1퍼센트라고 합니다. 그만큼 MBTI에 대한 관심도가 많아, 저희는 MBTI 데이터셋들을 구해 진행했습니다. 데이터셋 설명 총 3가지의 데이터셋을 사용했습니다. 첫 번째는 MBTI별로 포스팅한 데이터셋이고, 두 번째는 국가별 MBTI 비율 세 번째는 MBTI별로 Reddit이라는 외국사이트를 이용한 내역..
최근댓글