import pandas as pd train_data = pd.read_csv('./train.csv') train_data.head() Groupby 이해하기 모든 groupby 연산은 기존 객체에 대해 다음과 같은 연산 중 하나를 포함한다. 데이터 분할하기 데이터 연산하기 (통계적으로 계산, 조건에 맞는 데이터 걸러내기, 그룹별 작업 수행) 데이터 병합하기 1. 데이터 분할하기 1) groupby()를 이용한 데이터 분할 Pandas 객체를 분할할 때는 groupby() 메소드를 사용하며 인자로는 column이름이나 column으로 이루어진 리스트를 전달하면 된다. class_group = train_data.groupby('Pclass') class_group.groups 그렇게 만들어진 clas..
파이썬 검색 결과
1. 출력과 연산 출력 파이썬에서 출력하기 위한 문법은 print(출력하고 싶은 것)이다. 문자를 출력하고 싶을 때는 ""로 묶어주고, 숫자를 출력하고 싶을 땐 print(2)와 같이 그대로 쓰면 된다. 연산 +, -, *, / : 더하기 빼기 곱하기 나누기(왼쪽 순서대로) //, % : 몫 나머지(왼쪽 순서대로) - : 음수 ** : 제곱수 연산 주의사항 숫자 - 숫자, 문자 - 문자끼리 연산은 가능하지만 타입이 다른 숫자 - 문자끼리의 연산은 불가능하다. 2. 변수 어떠한 값을 저장하기 위해 변수라는 개념을 사용한다. 위에 예제와 같이 1이라는 값을 x라는 변수로 저장하여 x
import pandas as pd train_data = pd.read_csv('./train.csv') train_data.head() train_data.index = np.arange(100, 991) DataFrame에서 column 선택하기 DataFrame 형태의 데이터에서 [ ] 안에 특정 column의 이름을 넣으면, Series 형태로 값을 가져온다. Indexing 했기 때문에, 데이터의 형태는 DataFrame에서 Series로 한차원 낮아진다. train_data [ 'Survived' ] # 이름이 Survived인 column을 Series 형태로 출력 DataFrame 형태를 그대로 가져오고 싶으면 [ [ .... ] ] 형태로 사용하면 된다. 이때, 안쪽 대괄호 [ ......
csv 파일로 DateFrame 생성하기 import pandas as pd Format Type Data Description Reader Writer text CSV read_csv to_csv text JSON read_json to_json text HTML read_html to_html ..... Pandas I/O tools csv 파일이란, comma-separated values의 약자로, 데이터가 콤마( ,)로 구분되어 있는 파일을 뜻한다. 데이터 분석을 위해, dataframe을 생성하는 가장 일반적인 방법으로, 데이터 소스로부터 추출된 csv파일로 생성한다. pandas.read_csv pandas.read_csv( filepath_or_buffer, sep, delimiter, h..
DataFrame으로 dummy data 생성하기 import pandas as pd import numpy as np pandas.DataFrame pandas.DataFrame( data, index, columns, dtype, copy ) data ndarray, series, map, lists, dict, 상수 그리고 또 다른 DataFrame까지 변수의 형태로 가질 수 있다. index Index or array-like : row 레이블의 경우, 인덱스 값이 없으면 0-based index (np.arange(n))가 기본으로 사용된다. columns Index or array-like : column 레이블의 경우, 인덱스 값이 없으면 0-based index (np.arange(n))가..
1. DataFrame의 특징 2차원 데이터 구조로 index가 row와 column으로 구성되어 있다. column들이 서로 다른 타입일 수도 있다. 크기는 변할 수 있다. row는 각 개별 데이터를, column은 각 개별 속성(feautre)을 의미한다. row와 column에 산술 연산을 수행할 수 있다. import pandas as pd pandas.DataFrame 판다스 DataFrame은 다음과 같은 생성자를 사용해서 만들어진다. pandas.DataFrame( data, index, columns, dtype, copy ) data ndarray, series, map, lists, dict, 상수 그리고 또 다른 DataFrame까지 변수의 형태로 가질 수 있다. index row 레..
0. 정규 표현식을 지원하는 re 모듈 파이썬에서는 정규 표현식을 지원하기 위해 re (regular expression) 모듈을 제공한다. re 모듈은 파이썬을 설치할 때 자동으로 설치되는 기본 라이브러리로 따로 설치할 필요는 없다. import re 1. 메타 문자 (meta characters) 1. [ ] : 문자들의 집합을 나타냄 리스트안의 문자들은 각각 개별적으로 존재한다. (ex. [amk] 는 'a' 또는 'm' 또는 'k' 와 매치된다.) 하이픈(-)을 이용해서 문자들의 범위를 나타낸다. (ex. [a-z]는 아스키코드 상 a부터 z까지 알파벳을 나타낸다.) (ex. [0-5][0-9]는 숫자 00부터 59까지의 두자리 숫자를 나타낸다.) (ex. [a\-z] 또는 [-a], [a-]처럼..
최근댓글