안녕하세요 저는 브라이틱스 서포터즈 3기 이상민입니다 :) 벌써 브라이틱스 서포터즈 활동을 마치는 날이 다가왔는데요. 이번 포스팅을 마지막으로 브라이틱스 서포터즈와 관련된 포스팅은 마치려고 합니다. 지금까지 느꼈던 것들과 서포터즈 활동을 되돌아보며 들었던 주관적인 감정들에 대해 남겨보도록 하겠습니다 :) 브라이틱스를 처음 접해보며 서포터즈를 활동하면서 브라이틱스 스튜디오라는 분석 툴을 처음 접해보았는데요. 데이터분석을 꿈꾸는 많은 분들은 python인 R을 주로 사용하셨을 겁니다. 저또한 다른 언어를 주로 활용했었는데요. 브라이틱스를 접해보면서 자동화되어있는 모델링 과정이나 강력한 데이터분석 내장함수들이 매우 매력적으로 다가왔습니다. 다른 언어들은 코딩을 직접해야하고 분석가가 직..
브라이틱스데이터분석 검색 결과
안녕하세요 저는 브라이틱스 서포터즈 3기 이상민입니다 :) 저번 포스팅에는 변수 생성에 대해 간단히 설명 하였는데요. 이번 포스팅은 Modeling의 전 과정을 EDA부터 변수 생성까지 모두 압축해서 설명하겠습니다! 데이터 탐색 제주 테크노파크 제주도 도로 교통량 예측 앞선 주제는 제주도 도로 교통량 예측이었는데요. 먼저 다운받은 데이터를 브라이틱스의 Load Data 함수를 통해 불러와줍니다. 위와 같이 데이터를 불러와줬습니다! 그리고 위와 같은 여러 변수들이 있었습니다. 저는 target변수인 평균속도에 영향을 줄만한 변수들을 살펴보았는데요. 먼저 통계지표를 뽑아보며 0이나 이상치 값들이 있는 것을 볼 수 있습니다. 그 다음은 target(평균속도)인데요. 50정도에서 높은 ..
안녕하세요!! 삼성 SDS Brightics 서포터즈 3기 이상민입니다 :) 저번 포스팅은 텍스트 데이터를 전처리하는 법을 영화 리뷰 데이터를 통해서 소개했는데요. 이번 포스팅은 이어서 Data Modeling과 Text Analysis에 대해 다뤄보는 시간을 가져보겠습니다. Modeling이란? 먼저 모델링이라는 단어 자체에 대해 의미를 알아보자면 복잡한 현실세계를 단순화, 즉 사람이 이해할 수 있는 정보로 변환하는 과정입니다. 그리고 이것을 Data로도 진행할 수 있는데 일반적으로 Ai 모델이라고도 하며 많은 데이터를 이용해 데이터들의 패턴을 분석하고 결과를 예측하는 알고리즘을 설계하는 것을 의미합니다. 예시로는 우리가 흔히 일상생활에서 접하는 파파고 번역기나 네이버 악성 댓글 분류들도 다 이 Ai ..
안녕하세요 :) 삼성 SDS Brightics 서포터즈 3기 이상민입니다 :) 저번 포스팅은 영화 리뷰 데이터 분석 프로젝트 소개와 데이터셋 설명, Data Load를 진행했는데요 이번 포스팅은 이어서 Data Preprocessing, 즉 전처리에 대해 다뤄보는 시간을 가져보겠습니다. 데이터 전처리란? 데이터 전처리란 클리닝, 통합, 변환, 축소, 이산화의 과정이 있고 말 그대로 데이터를 분석 혹은 모델에 넣기 전 변환하는 과정을 말합니다. 텍스트 데이터에서는 더욱 더 중요하게 다뤄지는데요. 이는 컴퓨터는 0과 1같은 숫자밖에 인식하지 못하기 때문에 텍스트를 숫자로 변환해주는 과정을 거쳐야 합니다. 그럼 이렇게 중요한 텍스트 데이터의 전처리에 대해 알아볼까요? 저번 시간에 소개한 데이터 로드 방법에 맞..
최근댓글