데이터 과학에 대해 연구하는 사람이라면, 필요한 데이터를 구하는 능력도 중요하다. 여기서는 데이터를 구할만한 몇 가지 사이트를 소개하고자 한다.

 

1. Kaggle

이전에 소개했던 것과 같이, Kaggle은 데이터 과학에 관한 대회용 웹사이트로 주로 Python, R을 사용하도록 되어있다.

 

 

Kaggle: Your Machine Learning and Data Science Community

Kaggle is the world’s largest data science community with powerful tools and resources to help you achieve your data science goals.

www.kaggle.com

 

2. 공공 데이터 포털

공공데이터 역시 이전에 소개했지만, 우리나라 정부에서 주로 XML이나 CSV 형태로 데이터를 제공하니 사용하기 쉽다.

 

 

공공데이터 포털

국가에서 보유하고 있는 다양한 데이터를『공공데이터의 제공 및 이용 활성화에 관한 법률(제11956호)』에 따라 개방하여 국민들이 보다 쉽고 용이하게 공유•활용할 수 있도록 공공데이터(Datase

www.data.go.kr

 

3. data.gov

미국 행정부에서 제공하는 데이터 사이트로, 주로 정부와 관련된 데이터를 얻을 수 있다.

 

 

Data.gov

The home of the U.S. Government’s open data Here you will find data, tools, and resources to conduct research, develop web and mobile applications, design data visualizations, and more. For information regarding the Coronavirus/COVID-19, please visit Cor

www.data.gov

 

4. amazon 데이터

아마존에서 제공하는 데이터 사이트이지만, 위의 사이트와 비교하면 그렇게 많은 데이터는 없지만 한 번 쯤은 사용할 만하다.

 

 

Registry of Open Data on AWS

astronomy The data are from observations with the Murchison Widefield Array (MWA) which is a Square Kilometer Array (SKA) precursor in Western Australia. This particular dataset is from the Epoch of Reionization project which is a key science driver of the

registry.opendata.aws

728x90
반응형
  • 네이버 블러그 공유하기
  • 네이버 밴드에 공유하기
  • 페이스북 공유하기
  • 라이프코리아트위터 공유하기
  • shared
  • 카카오스토리 공유하기