안녕하세요 저는 브라이틱스 서포터즈 3기 이상민입니다 :) 벌써 브라이틱스 서포터즈 활동을 마치는 날이 다가왔는데요. 이번 포스팅을 마지막으로 브라이틱스 서포터즈와 관련된 포스팅은 마치려고 합니다. 지금까지 느꼈던 것들과 서포터즈 활동을 되돌아보며 들었던 주관적인 감정들에 대해 남겨보도록 하겠습니다 :) 브라이틱스를 처음 접해보며 서포터즈를 활동하면서 브라이틱스 스튜디오라는 분석 툴을 처음 접해보았는데요. 데이터분석을 꿈꾸는 많은 분들은 python인 R을 주로 사용하셨을 겁니다. 저또한 다른 언어를 주로 활용했었는데요. 브라이틱스를 접해보면서 자동화되어있는 모델링 과정이나 강력한 데이터분석 내장함수들이 매우 매력적으로 다가왔습니다. 다른 언어들은 코딩을 직접해야하고 분석가가 직..
브라이틱스서포터즈 검색 결과
안녕하세요 저는 브라이틱스 서포터즈 3기 이상민입니다 :) 저번 포스팅에는 변수 생성에 대해 간단히 설명 하였는데요. 이번 포스팅은 Modeling의 전 과정을 EDA부터 변수 생성까지 모두 압축해서 설명하겠습니다! 데이터 탐색 제주 테크노파크 제주도 도로 교통량 예측 앞선 주제는 제주도 도로 교통량 예측이었는데요. 먼저 다운받은 데이터를 브라이틱스의 Load Data 함수를 통해 불러와줍니다. 위와 같이 데이터를 불러와줬습니다! 그리고 위와 같은 여러 변수들이 있었습니다. 저는 target변수인 평균속도에 영향을 줄만한 변수들을 살펴보았는데요. 먼저 통계지표를 뽑아보며 0이나 이상치 값들이 있는 것을 볼 수 있습니다. 그 다음은 target(평균속도)인데요. 50정도에서 높은 ..
. 안녕하세요 저는 브라이틱스 서포터즈 3기 이상민입니다 :) 저번 포스팅에는 개인 프로젝트인 제주도 도로 교통량예측 데이터 EDA를 진행했는데요. 이번 포스팅은 Baseline Model(기준 모델)을 구현하며 분석의 기준점을 세우고 추가적인 실험을 진행하여 성능을 높이고자 합니다. 왜 feature engineering이 아닌 Baseline model부터 만드나요?? 기본적으로 데이터분석을 진행하신 분들은 궁금증을 가지실 수 있습니다. 출처 : https://www.heavy.ai/technical-glossary/feature-engineering 맞습니다! 기본적인 분석 과정은 데이터 수집 -> EDA -> Feature engineering(변수 생성&조합) -> Modeling -..
안녕하세요 저는 브라이틱스 서포터즈 3기 이상민입니다 :) 저번 포스팅에는 개인 프로젝트 소개를 간단히 하였는데요. 이번 포스팅은 EDA(데이터 탐색)를 진행하며 데이터에 대해 본격적으로 분석을 진행하려고 합니다. 데이터 탐색 제주 테크노파크 제주도 도로 교통량 예측 앞선 주제는 제주도 도로 교통량 예측이었는데요. 먼저 다운받은 데이터를 브라이틱스의 Load Data 함수를 통해 불러와줍니다. 위와 같이 데이터를 불러와줬습니다! 그 후 변수에 대해 차근차근 살펴봤는데요. 문자로 되어있으면 문자, 숫자로 되어있으면 숫자 이렇게 분류하는 것보다는 datetime(시간), categorical(명목형 변수), numerical(수치형 변수), position(위치) 이렇게 변수를 타입에 따라..
안녕하세요 저번 팀 영상 제작에 이어 다시 돌아온 브라이틱스 서포터즈 3기 이상민입니다. 다들 영상은 잘 보고 오셨나요? 제 발연기가 너무 부끄럽네요.. 이번 포스팅은 개인 프로젝트인데요. 공공데이터를 활용해 브라이틱스로 분석을 진행하는 것입니다! 그럼 제가 선정한 주제와 데이터에 대해 알아보러 갈까요? 주제 소개 "카드소비 데이터를 활용한 고객 세분화 및 재구매주기 예측" 출처 : https://realestate.daum.net/news/detail/hotissue/1087461/20161104143603165 big blur, 산업 간 경계가 허물어지면 다양한 유형의 데이터들이 유기적으로 연결되어 활용되고 있는데요. 특히 개인의 개성과 선호도가 뚜렷해져 고객을 세분화시켜 서비스를 제안..
안녕하세요 :) 저번주 Brightics 서포터즈 팀 미션인 홍보 영상 촬영 현장 두 번째 포스팅에 이어, 마지막 포스팅을 이어서 작성하였습니다. 저는 브라이틱스 서포터즈 3기, 3조의 이상민으로 총 5명의 팀원으로 구성되어있습니다. 저희 팀의 영상 주제는 MBTI 과몰입 소개팅 with 브라이틱스를 통한 MBTI 예측 였는데요. 저번주 촬영을 마치고 영상을 제작하면서 이번 포스팅은 후기와 느낀점을 주로 작성할 예정입니다! 저번 포스팅에는 촬영 현장을 소개했는데요. 이번 영상을 촬영하면서 정말 많은 회의를 거친 것 같습니다. 공식 회의만 8번?? + 비공식 a.. 8월 달에는 영상을 촬영하기 위한 계획을 주로 수립하고 처음에는 정말 어색했지만 MBTI 얘기하면서 친해졌습니다.. 9월..
안녕하세요 :) 저번주 Brightics 서포터즈 팀 미션인 홍보 영상 제작기 첫 번째 포스팅에 이어, 두 번째 포스팅을 이어서 작성하였습니다. 저는 브라이틱스 서포터즈 3기, 3조의 이상민으로 총 5명의 팀원으로 구성되어있습니다. 저희 팀의 영상 주제는 MBTI 과몰입 소개팅 with 브라이틱스를 통한 MBTI 예측 였는데요. 이 주제를 가지고 이번 주는 대본을 구성하고 직접 촬영까지 했습니다! 17일 토요일 오후 2시에 신촌역에서 모여서 촬영을 진행했는데요. 촬영은 수현이의 오피스텔 건물에서 촬영했습니다. 오피스텔 굉장히 좋더라고요 대본은 총 4개의 시나리오로 구성했는데요. 간단하게 설명드리자면 첫 번째는 MBTI 과몰입에 빠진 한 사람이 소개팅 상대를 찾기 위해 회사에 문의하는 상..
안녕하세요!! 저번주에 MBTI 예측 기획 및 구상에 이어 1주만에 다시 돌아온 브라이티스 서포터즈 3기 이상민입니다. 이번주는 업무분배 및 주제구체화 그리고 간단하게 브라이틱스를 이용하여 MBTI예측 프로젝트를 진행했는데요. 그럼 어떻게 했는지 함께 알아보러 가실까요?? 저희가 정했던 프로젝트 주제는 텍스트 데이터로 MBTI예측하기였는데요. MBTI별 포스팅 : https://www.kaggle.com/code/mercurio117/mbti-500/data 국가별 MBTI 비율 : https://www.kaggle.com/datasets/yamaerenay/mbtitypes-full reddit mbti별 발자취 : https://www.kaggle.com/datasets/michaelkit..
안녕하세요 팀 분석 프로젝트로 돌아온 브라이틱스 서포터즈 3기 이상민입니다 :) 이번 주부터 4주 동안은 브라이틱스 서포터즈 3조로서 팀원들과 함께 데이터분석 팀 프로젝트를 진행하게 되었는데요. 분석 결과를 바탕으로 영상 제작도 진행할 예정이니 다들 기대해주세요!! 저희 3조가 진행할 팀 분석 프로젝트는 텍스트 데이터로 MBTI 예측하기입니다. MBTI란 정신분석학자 카를 융(Carl Jung)의 심리 유형론을 토대로 만든 성격 유형 검사인데요. 네 가지의 상대적인 선호 지표를 조합해 사람의 성격 유형을 16가지로 분류합니다. 이런 MBTI를 텍스트로 분류해보면 어떨까요?? 데이터는?? MBTI별 포스팅 : https://www.kaggle.com/code/mercurio117/mbti-500/data ..
안녕하세요 :) 삼성 SDS Brightics 서포터즈 3기 이상민입니다 :) 저번 포스팅은 영화 리뷰 데이터 분석 프로젝트 소개와 데이터셋 설명, Data Load를 진행했는데요 이번 포스팅은 이어서 Data Preprocessing, 즉 전처리에 대해 다뤄보는 시간을 가져보겠습니다. 데이터 전처리란? 데이터 전처리란 클리닝, 통합, 변환, 축소, 이산화의 과정이 있고 말 그대로 데이터를 분석 혹은 모델에 넣기 전 변환하는 과정을 말합니다. 텍스트 데이터에서는 더욱 더 중요하게 다뤄지는데요. 이는 컴퓨터는 0과 1같은 숫자밖에 인식하지 못하기 때문에 텍스트를 숫자로 변환해주는 과정을 거쳐야 합니다. 그럼 이렇게 중요한 텍스트 데이터의 전처리에 대해 알아볼까요? 저번 시간에 소개한 데이터 로드 방법에 맞..
최근댓글