728x90
◈ Pandas ?
: 구조화된 데이터나 표 형식의 데이터를 빠르고 쉽게 다룰 수 있도록 하는 라이브러리
: Series - 1차원 데이터, DataFrame - 2차원 데이터
DataFrame = Series + Series
- Series : List와 다르게 index를 직접 지정할 수 있다. 설정을 안 해주면 0, 1, 2...로 설정됨.
- DataFrame : 인덱스와 컬럼을 기준으로 표 형태처럼 데이터를 저장.
▼ DataFrame 생성해 보기!
import pandas as pd
student_list = [['철수', 100, 90, 85], ['영희', 70, 80, 85], ['진구', 95, 75, 80]]
df = pd.DataFrame(student_list)
df
columns와 index를 직접 설정해줬을 때,
columns와 index를 조회해 보고, dtype으로 DataFrame의 자료형을 조회해 보면
numpy와 다르게 문자형, 숫자형 다양한 자료형의 값들을 정상적으로 출력해 준다는 점을 확인할 수 있다 !
단, 같은 컬럼에서는 같은 자료형을 사용해야 된다 !!! (주의 )
< pandas의 dtype >
- int64 : 정수
- float64 : 소수
- object : 텍스트
- bool : 불린(참, 거짓)
- datetime64 : 날짜와 시간
- category : 카테고리
▼ 데이터 타입 변경
.astype('데이터타입')
size.astype('float') // 데이터 타입 변경
size.astype({'콩다' : 'float'}) // 특정 컬럼에 대해서 데이터 타입 변경
728x90
반응형
'BE > Python' 카테고리의 다른 글
[Python] 데이터 시각화 - Seaborn 통계 데이터 시각화 (1) | 2023.11.21 |
---|---|
[Python] 데이터 시각화 - Matplotlib 그래프 그리기 (1) | 2023.11.17 |
[Python] Numpy 유용한 함수 (통계 함수) (0) | 2023.11.16 |
[Python] Numpy란? numpy array 생성하기 (0) | 2023.11.14 |
[Python] 모듈(module) 사용하기 (1) | 2023.11.13 |
댓글