1. 데이터 사이언스의 개념

1- 1 데이터 사이언스란?

정형, 비정형 형태를 포함한 다양한 데이터로부터 지식과 인사이트를 추출할 때, 과학적 방법론과 프로세스, 알고리즘, 시스템을 동원하는 융합분야

IT프로그래밍 기술, 통계적 분석능력, 인문학적인 사고가 균형있게 잡혀있어야 함

현재는 데이터 엔지니어링, 분석, 마케팅 등 여러분야에 쓰이고 인공지능(머신러닝,딥러닝)에도 매우 유망있고 촉망받는 분야


1-2 필요한 지식과 학문

1)  IT프로그래밍 기술

Python, R 등등 언어 : 데이터 사이언스 분야에 가장 많이 쓰이는 프로그래밍 언어로 Python(범용성)과 R(통계 특화)이 있다. 그 외에 C언어 계열이나 java와 같은 객체 지향 언어를 더불어 공부하면 좋음.

데이터 분석 라이브러리 : 대표적으로는 Python의 beautifulsoup4(수집),numpy(series), pandas, seaborn(시각화) 의 문법들과 활용 방안들을 공부해보면 좋음.

데이터베이스 활용능력 - sql문법이나 hadoop, spark와 같이 데이터베이스 관련 처리기술, 능력을 기르면 좋다.

머신러닝(Machine Learning, 기계학습) : 인공지능의 한 분야로 데이터를 바탕으로 컴퓨터에게 학습을 시켜, 새로운 지식을 얻어내게 하는 방법 (지도학습과 비지도학습으로 나눠짐)

딥러닝(Deep Learning : 인공 신경망의 한계를 극복하기 위해 제안된 기계학습 방법이다. 인공의 뇌구조를 알고리즘으로 짜서, 컴퓨터에게 매우 많은 양을 학습시키는 방법 (객체 검출, 이미지, 동영상, 음성에 많이 쓰이고 연구되고 있다)


2) 분석 능력

수학, 통계적 지식 : 선형대수, 회귀분석, 확률 등 수학과 통계적 지식이 많이 쓰인다. 데이터를 벡터화 시키거나 알고리즘을 구성할 때, 수학적 이론이 매우 중요함

데이터 지능 : 데이터 사이언스는 데이터 수집, 분석, 시각화의 한 과정을 통해 데이터를 처리한다. 데이터를 보고 어느 가치를 뽑아낼 수 있는지가 매우 중요한데, 최대한 많이 데이터를 다뤄보며 관계를 파악해본다.

domain knowledge(특정 영역에 대한 지식) : 어떠한 가치를 뽑아내기 위해서는 해당된 데이터에 관련된 분야의 지식을 알아야한다. 특히 생명(의료), 경영(마케팅), 지리 등에 대해 많이 쓰이는데, 관련된 지식을 알아야 무엇이 중요하고 어떻게 해석할지 잡히게 된다.


 3) 인문학적인 사고

상상력과 통찰력 : 새롭게 가치를 창출하기 위해서는 상상력과 통찰력이 필요하다. 데이터(data)를 정보(information)로 바꾸는 능력

협동 및 커뮤니케이션 : 보통 실무에서 협업을 하면서 의사소통을 하는데, 이 과정에서 이와 같은 능력들이 매우 필요하다. 

설득력과 표현력 : 무슨 생각을 하는지, 무슨 결과를 말하고 가치를 도출하고 싶은지 말하는 능력. 아무리 기술력이 뛰어나 데이터를 처리한다 해도, 가치를 뽑아낸다 해도 사람들에게 제대로 전달되고 표현되지 않으면 좋은 서비스나 상품을 만들 수 없다.

 


 

2. 데이터 사이언스 관련 유용한 사이트

1) 논문

https://www.dbpia.co.kr/학술 논문 검색 사이트 - 데이터 분야는 트렌드에 민감하여, 최신 논문을 많이 읽고 기술을 배워야 한다.

 

http://www.riss.kr/index.do

학술 논문 검색 사이트 - 위 사이트와 마찬가지로 분야별 논문 사이트


2) 데이터 사이언스 인강

https://www.inflearn.com/

인프런 - 한국어로 된 인강 사이트. 프로그래밍 외에 카테고리별로 정리가 잘 되어있다.

 

https://www.fastcampus.co.kr/

패스트캠퍼스 - 오프라인, 온라인 수업이 둘 다 있고 가격이 오프라인은 가격이 좀 있다. (실무진들이 알려주는 사이트)

https://dsschool.co.kr/

DS스쿨 - 패스트캠퍼스와 마찬가지로 오프라인, 온라인 둘 다 있고 데이터 분석 특화 교육 사이트

https://www.udemy.com/

유데미 - 외국 사이트로 자료의 질과 양이 가장 좋고 많다. 영어가 된다면 가장 좋은 사이트

 


3) 알고리즘 공부 사이트

https://www.acmicpc.net/

백준 알고리즘 사이트 - 단계별로 프로그래밍 언어와 알고리즘을 공부할 수 있는 사이트

https://programmers.co.kr/

프로그래머스 - 백준과 마찬가지로 알고리즘 공부 사이트.

https://www.codeup.kr/

코드업 - 프로그래밍에 입문 하는 분이라면 코드100제로 기본 문법을 공부하길 권장함


4) 그 외 추천 사이트

모두의 딥러닝(김성) - 유튜브와 인프런으로 활동하시며 강의가 깔끔하게 정리되어 있다. 현재 시즌2까지 나옴

생활코딩 - 프론트 엔드, 백 엔드 다 알려주시면 프로그래밍 전반적으로 카테고리별로 공부할 수 있는 사이트

 


 

3. 관련 자격증

사회조사 분석사 - 국가공인자격증으로 1급과 2급으로 급수가 나뉘어져 있다. 필기, 서술형, 실기로 나뉘어져 있다. 사회조사방법론, 설문조사, 통계지식 등 기본적인 이론을 공부할 수 있음.

컴퓨터활용능력 - 액셀, 액세스 관련 사무 자격증으로, 프로그래밍과는 거리가 멀지만 데이터 분석을 하기 위해서 액셀이 많이 쓰일 때가 많은데 따두면 좋긴 함

Adsp, Adp(데이터 분석 자격증) - 한국데이터진흥원의 주관으로 만들어진 자격증. 가장 연관이 높으며 데이터 분석의 전반적인 이론과 기술들을 공부할 수 있음.

Sqld, Sqlp(sql 관련 자격증) - 데이터베이스가 쌓이면 데이터를 얻어와야 하는데 이 때, sql이 많이 쓰인다. 기본적으로 따두면 좋긴 한 자격증

정보처리기사 - 컴퓨터 관련 자격증

DAP, DAsP - 데이터 아키텍처 자격증

 


 

4. 관련 동아리, 학회

BOAZ - 빅데이터 동아리로서, 연세대학교 교수님이 책임교수님이자 빅데이터 관련 최초의 동아리. 공모전이나 관련 수상도 많이 함

투빅스 - 보아즈와 마찬가지로 빅데이터 동아리. 수상경력이 매우 화려하며 실력이 매우 출중한 사람들이 많음

비타민 - 작년까지 R을 바탕으로 공부했으나, 현재는 Python을 바탕으로 공부중. 마찬가지로 빅데이터 동아리임

큐시즘 - IT경영학회로서 다양한 전공의 사람들이 모여서 학술 및 공부를 함. 정기 커리큘럼 / 학술제 / 스터디/ 해커톤 등등 학술 외에 같이 컨퍼런스와 강연회를 함으로서 IT에 관해 전반적으로 알 수 있음.

멋쟁이사자처럼 - 프로그래밍 동아리로서 코딩 교육을 하고 매우 실력 좋은 사람들이 많은걸로 암. 이두희가 대표

YAPP - 기업형 IT 동아리. 제출서류에 개인 포트폴리오가 있을 정도로 매우 실력있는 동아리.

연세대학교 빅데이터 학회(와이빅타) - 굉장히 빅데이터에 관심이 많은 사람들이 많음. but 연세대학교 학생들만 뽑음

 


 

5. 그 외 데이터 분석 공부하기 좋은 사이트

Kaggle - 데이터 컴피티션 사이트. 항상 데이터 관련 주제를 가지고 대회가 열리며 상금과 랭킹이 있음. 데이터 셋이 매우 많아 데이터 분석 공부하기 좋은 사이트. 추천 : kaggle(정형), imdb(텍스트), mnist(이미지) 등등

DACON - 한국형 kaggle 사이트. 우리나라의 데이터 관련 공모전 사이트이다. 공모전이 자주 열리고 kaggle과 마찬가지로 실력 향상 및 검증받을 수 있는 사이트

tensorflow 학회(facebook 페이지) - 딥러닝 관련해서 최신 트렌드와 기술들에 대해 알려주고 공유하는 페이스북 페이지

kaggle 한국(facebook 페이지) - kaggle의 데이터 분석 방법을 공유하고 서로 피드백해주는 페이스북 페이지

 

728x90
반응형
  • 네이버 블러그 공유하기
  • 네이버 밴드에 공유하기
  • 페이스북 공유하기
  • 라이프코리아트위터 공유하기
  • shared
  • 카카오스토리 공유하기