안녕하세요 저는 브라이틱스 서포터즈 3기 이상민입니다 :) 벌써 브라이틱스 서포터즈 활동을 마치는 날이 다가왔는데요. 이번 포스팅을 마지막으로 브라이틱스 서포터즈와 관련된 포스팅은 마치려고 합니다. 지금까지 느꼈던 것들과 서포터즈 활동을 되돌아보며 들었던 주관적인 감정들에 대해 남겨보도록 하겠습니다 :) 브라이틱스를 처음 접해보며 서포터즈를 활동하면서 브라이틱스 스튜디오라는 분석 툴을 처음 접해보았는데요. 데이터분석을 꿈꾸는 많은 분들은 python인 R을 주로 사용하셨을 겁니다. 저또한 다른 언어를 주로 활용했었는데요. 브라이틱스를 접해보면서 자동화되어있는 모델링 과정이나 강력한 데이터분석 내장함수들이 매우 매력적으로 다가왔습니다. 다른 언어들은 코딩을 직접해야하고 분석가가 직..
브라이틱스스튜디오 검색 결과
. 안녕하세요 저는 브라이틱스 서포터즈 3기 이상민입니다 :) 저번 포스팅에는 개인 프로젝트인 제주도 도로 교통량예측 데이터 EDA를 진행했는데요. 이번 포스팅은 Baseline Model(기준 모델)을 구현하며 분석의 기준점을 세우고 추가적인 실험을 진행하여 성능을 높이고자 합니다. 왜 feature engineering이 아닌 Baseline model부터 만드나요?? 기본적으로 데이터분석을 진행하신 분들은 궁금증을 가지실 수 있습니다. 출처 : https://www.heavy.ai/technical-glossary/feature-engineering 맞습니다! 기본적인 분석 과정은 데이터 수집 -> EDA -> Feature engineering(변수 생성&조합) -> Modeling -..
안녕하세요 저는 브라이틱스 서포터즈 3기 이상민입니다 :) 저번 포스팅에는 개인 프로젝트 소개를 간단히 하였는데요. 이번 포스팅은 EDA(데이터 탐색)를 진행하며 데이터에 대해 본격적으로 분석을 진행하려고 합니다. 데이터 탐색 제주 테크노파크 제주도 도로 교통량 예측 앞선 주제는 제주도 도로 교통량 예측이었는데요. 먼저 다운받은 데이터를 브라이틱스의 Load Data 함수를 통해 불러와줍니다. 위와 같이 데이터를 불러와줬습니다! 그 후 변수에 대해 차근차근 살펴봤는데요. 문자로 되어있으면 문자, 숫자로 되어있으면 숫자 이렇게 분류하는 것보다는 datetime(시간), categorical(명목형 변수), numerical(수치형 변수), position(위치) 이렇게 변수를 타입에 따라..
안녕하세요!! 오늘은 Brightics 서포터즈의 팀 미션인 홍보 영상 제작기의 첫 번째 포스팅을 작성하게 되었습니다. 저는 브라이틱스 서포터즈 3기, 3조의 이상민입니다 :) 총 5명의 팀원으로 구성되어있습니다. 저번 팀 분석 프로젝트였던 MBTI 예측하기의 주제를 이어서 홍보 영상으로 제작하는 프로젝트인데요. 저희 조의 홍보 영상 제작기에 대해서 지금부터 소개해드리도록 하겠습니다!! 영상 주제 선정 배경 저희 조는 노션을 통해서 회의를 진행하였고, 영상 제작에 대해서 3가지 기준을 정해봤는데요. 첫 번째는 "브라이틱스의 기능들을 최대한 활용할 수 있는가?" 입니다! 출처 : https://www.brightics.ai/kr/docs/ai/manual/tutorial/b19f13b94cc..
안녕하세요!! 삼성 SDS Brightics 서포터즈 3기 이상민입니다 :) 저번 포스팅은 텍스트 데이터를 전처리하는 법을 영화 리뷰 데이터를 통해서 소개했는데요. 이번 포스팅은 이어서 Data Modeling과 Text Analysis에 대해 다뤄보는 시간을 가져보겠습니다. Modeling이란? 먼저 모델링이라는 단어 자체에 대해 의미를 알아보자면 복잡한 현실세계를 단순화, 즉 사람이 이해할 수 있는 정보로 변환하는 과정입니다. 그리고 이것을 Data로도 진행할 수 있는데 일반적으로 Ai 모델이라고도 하며 많은 데이터를 이용해 데이터들의 패턴을 분석하고 결과를 예측하는 알고리즘을 설계하는 것을 의미합니다. 예시로는 우리가 흔히 일상생활에서 접하는 파파고 번역기나 네이버 악성 댓글 분류들도 다 이 Ai ..
안녕하세요 :) 삼성 SDS Brightics 서포터즈 3기 이상민입니다 :) 저번 포스팅은 영화 리뷰 데이터 분석 프로젝트 소개와 데이터셋 설명, Data Load를 진행했는데요 이번 포스팅은 이어서 Data Preprocessing, 즉 전처리에 대해 다뤄보는 시간을 가져보겠습니다. 데이터 전처리란? 데이터 전처리란 클리닝, 통합, 변환, 축소, 이산화의 과정이 있고 말 그대로 데이터를 분석 혹은 모델에 넣기 전 변환하는 과정을 말합니다. 텍스트 데이터에서는 더욱 더 중요하게 다뤄지는데요. 이는 컴퓨터는 0과 1같은 숫자밖에 인식하지 못하기 때문에 텍스트를 숫자로 변환해주는 과정을 거쳐야 합니다. 그럼 이렇게 중요한 텍스트 데이터의 전처리에 대해 알아볼까요? 저번 시간에 소개한 데이터 로드 방법에 맞..
최근댓글