-
[pandas] 기초 입문 1 - 데이터프레임, 시리즈Programming/Python 2022. 3. 8. 17:31
0. pandas?
python 라이브러리로 데이터를 수정하고 목적에 맞게 변경시키기 위해 사용되는 중요한 라이브러리이다.
python 실습
import pandas as pd #pandas를 pd로 사용하겠다는 의미
data_frame = pd.read_cav('data/list.csv') #list.csv라는 csv 파일을 가져와서 data frame 형성
* 엑셀과 팬더스의 차이
팬더스는 numpy를 사용하였기에 숫자 연산에 강력하다. (엑셀보다 계산이 매우 빠르다)
ex
data_frame.head() #처음부터 5개까지만 보여줌
data_frame.head(2) #처음부터 2개까지만 보여줌
data_frame.tail(2)
1. 데이터 프레임, 시리즈
data_frame은 시리즈의 결합체이다. 이 시리즈는 파이썬의 리스트로 형성한다. 파이썬 리스트는 list = [1,2,3] 이런 시으로 만든다.
시리즈 2개로 데이터 프레임을 만드는 실습
s1 = pd.core.series.Series( [1,2,3] ) s2 = pd.core.series.Series( ['one', 'two', 'three'] ) pd.DataFrame{data = dict (num=s1, word=s2) }
실행 결과 dataframe이 잘 나옴을 확인할 수 있다.
2. 파일에서 데이터 불러오기
1) csv 파일
파일 경로: data/파일명.csv
df = pd.read_csv('data/파일명.csv') df.head() df.tail()
2) txt 파일
df = pd.read_csv('data/파일명.txt', delimiter = '\t') #delimiter = 컬럼은 \t(탭)으로 구분, 디폴트는 ,(쉼표)이다
3) txt 파일에 header가 없는 경우
df = pd.read_csv('data/파일명.txt', header = None) #header가 없어서 0, 1, 2로 나옴 df.columns = ['name', 'sex', 'number'] #header를 name, sex, number로 설정함
df = pd.read_csv('data/파일명.txt', header = None, names = ['name', 'sex', 'number'])
'Programming > Python' 카테고리의 다른 글
[PyScript] html에서 파이썬 코드 실행하는 프레임워크 (0) 2022.05.23 [OpenCV] 노트북 캠 스트리밍 하기 (0) 2022.05.19 [turtle] 파이썬으로 다중원 그려서 과녁 모양 만드는 프로그램 (0) 2022.04.10 [문제풀이] 정수를 입력받아서 한 자리씩 출력하는 프로그램 (0) 2022.04.10 [Matlab] 기본 정리 (0) 2022.03.26