안녕하세요 저번 개인 프로젝트 소개에 이어 다시 돌아온 브라이틱스 서포터즈 3기 이상민입니다. 먼저 주제를 바꿔 죄송하다는 점을 말씀 드리고 싶고, 다른 주제를 진행하게 되어 양해를 구합니다 ㅠㅠ 저번에 제가 설정한 주제는 카도소비 데이터를 활용한 고객 세분화 및 재구매주기 예측인데요. 카드 데이터를 확보함에 있어서 개인의 인적정보를 활용하여 침해할 수 있기에 카드 데이터는 공공연하게 쓸 수 없을 것 같습니다. 이에 따라 개인의 정보를 침해하지 않는 선에서 진행할 수 있는 주제를 다시 정해보았는데요. 그럼 주제를 다시 알아보러 가볼까요? 주제 소개 제주 테크노파크 제주도 도로 교통량 예측 해당 주제는 데이콘에서 진행중인데요. 요즘 자동차의 이용량이 많아지고, 관광객들의 증가로 제주도의 ..
브라이틱스 서포터즈 검색 결과
안녕하세요 :) 저번주에 머신러닝/딥러닝 모델로 MBTI분류하기에 이어 1주만에 다시 돌아온 브라이티스 서포터즈 3기 이상민입니다. 이번주는 지금까지 진행한 팀프로젝트를 총집합하여 정리하였습니다. 어떻게 브라이틱스로 MBTI를 예측하고 분석했는지 한 번 알아보러 갈까요?? 저희팀은 3~4주동안 MBTI예측하기 프로젝트를 진행했는데요. 엠브레인 통계조사에서 MBTI에 대한 관심도는 무려 76.1퍼센트라고 합니다. 그만큼 MBTI에 대한 관심도가 많아, 저희는 MBTI 데이터셋들을 구해 진행했습니다. 데이터셋 설명 총 3가지의 데이터셋을 사용했습니다. 첫 번째는 MBTI별로 포스팅한 데이터셋이고, 두 번째는 국가별 MBTI 비율 세 번째는 MBTI별로 Reddit이라는 외국사이트를 이용한 내역..
안녕하세요 :) 저번주에 MBTI 예측 업무분배 및 주제구체화에 이어 1주만에 다시 돌아온 브라이티스 서포터즈 3기 이상민입니다. 이번주는 머신러닝, 딥러닝 모델로 MBTI를 분류하고 성능을 검증해보았는데요. 어떤 MBTI가 예측하기 쉬운지, 성능은 어느정도로 나왔는지 한 번 알아보러 가실까요?? 머신러닝, 딥러닝 모델로 MBTI 분류하기 저번주까지는 MBTI 데이터셋을 토큰화하는 과정까지 진행했는데요. 이번에는 토큰화 후, 임의의 벡터로 변환하는 과정과 그 벡터를 머신러닝, 딥러닝 모델에 넣어 학습하는 과정을 소개하겠습니다. 먼저 앞서 토큰화한 단어들을 브라이틱스 내에 있는 Bag of Words라는 함수를 사용해 텍스트를 숫자로 변환할 수 있는 토대를 만들어줍니다. Bag of Words란..
안녕하세요!! 삼성 SDS Brightics 서포터즈 3기 이상민입니다. 저번 포스팅으로 Brightics 서포터즈 3기 발대식 후기를 작성했었는데요 그 감동과 여운을 바탕으로 이번 포스팅은 주제를 정해 분석하는 개인 분석 프로젝트!! 주제 및 데이터셋 설명과 Data Load에 대해 작성하겠습니다 :) 주제 선정 아무래도 제가 가장 자신있는 분야이기도 하고 기존 연구실 경험을 살려 텍스트 데이터를 다뤄보는 주제로 선정하였습니다. 바로 '영화 리뷰 데이터 분석하기 with text analysis'라는 주제로 여러분들에게 친숙한 영화라는 데이터셋을 텍스트 데이터와 함께 분석해보는 시간을 가져보겠습니다. 텍스트 분석이란? 데이터의 유형에는 정형데이터, 이미지, 텍스트, 음성 등 여러 가지의 유형이 있고..
안녕하세요!! 삼성 SDS Brightics 서포터즈 3기 이상민입니다. 저번 포스팅은 삼성 SDS Brightics 서포터즈로 합격하고 Brightics를 소개하는 내용을 다뤘는데요 이번에는 Brightics 서포터즈 3기 발대식을 다녀온 후기를 포스팅하겠습니다! 이번 3기는 오프라인으로 잠실에 있는 삼성 SDS 본사에서 진행됐는데요 위 사진처럼 삼성 SDS 본사 입구를 봤을 때부터 심장이 두근거렸습니다.. 본사에 들어가고 예정된 시간에 발대식이 진행되었는데요. 발대식 순서는 아래와 같이 1) 환영사 2) 서포터즈 활동 소개 3) 사진촬영 4) 팀 편성 및 멘토소개 5) EBC 투어 순서로 진행됐습니다! 환영사는 그룹장님과 부사장님께서 진행해주셨는데, 데이터분석가가 갖춰야 할 마음가짐에 대해 주로 ..
최근댓글