안녕하세요 :) 저번주에 머신러닝/딥러닝 모델로 MBTI분류하기에 이어 1주만에 다시 돌아온 브라이티스 서포터즈 3기 이상민입니다. 이번주는 지금까지 진행한 팀프로젝트를 총집합하여 정리하였습니다. 어떻게 브라이틱스로 MBTI를 예측하고 분석했는지 한 번 알아보러 갈까요?? 저희팀은 3~4주동안 MBTI예측하기 프로젝트를 진행했는데요. 엠브레인 통계조사에서 MBTI에 대한 관심도는 무려 76.1퍼센트라고 합니다. 그만큼 MBTI에 대한 관심도가 많아, 저희는 MBTI 데이터셋들을 구해 진행했습니다. 데이터셋 설명 총 3가지의 데이터셋을 사용했습니다. 첫 번째는 MBTI별로 포스팅한 데이터셋이고, 두 번째는 국가별 MBTI 비율 세 번째는 MBTI별로 Reddit이라는 외국사이트를 이용한 내역..
브라이틱스 텍스트마이닝 검색 결과
안녕하세요 :) 저번주에 MBTI 예측 업무분배 및 주제구체화에 이어 1주만에 다시 돌아온 브라이티스 서포터즈 3기 이상민입니다. 이번주는 머신러닝, 딥러닝 모델로 MBTI를 분류하고 성능을 검증해보았는데요. 어떤 MBTI가 예측하기 쉬운지, 성능은 어느정도로 나왔는지 한 번 알아보러 가실까요?? 머신러닝, 딥러닝 모델로 MBTI 분류하기 저번주까지는 MBTI 데이터셋을 토큰화하는 과정까지 진행했는데요. 이번에는 토큰화 후, 임의의 벡터로 변환하는 과정과 그 벡터를 머신러닝, 딥러닝 모델에 넣어 학습하는 과정을 소개하겠습니다. 먼저 앞서 토큰화한 단어들을 브라이틱스 내에 있는 Bag of Words라는 함수를 사용해 텍스트를 숫자로 변환할 수 있는 토대를 만들어줍니다. Bag of Words란..
안녕하세요!! 저번주에 MBTI 예측 기획 및 구상에 이어 1주만에 다시 돌아온 브라이티스 서포터즈 3기 이상민입니다. 이번주는 업무분배 및 주제구체화 그리고 간단하게 브라이틱스를 이용하여 MBTI예측 프로젝트를 진행했는데요. 그럼 어떻게 했는지 함께 알아보러 가실까요?? 저희가 정했던 프로젝트 주제는 텍스트 데이터로 MBTI예측하기였는데요. MBTI별 포스팅 : https://www.kaggle.com/code/mercurio117/mbti-500/data 국가별 MBTI 비율 : https://www.kaggle.com/datasets/yamaerenay/mbtitypes-full reddit mbti별 발자취 : https://www.kaggle.com/datasets/michaelkit..
최근댓글