BE/Python

[Python] pandas로 데이터 분석하기 - DataFrame 생성.

콩다영 2023. 11. 17.
728x90

◈ Pandas ?

: 구조화된 데이터나 표 형식의 데이터를 빠르고 쉽게 다룰 수 있도록 하는 라이브러리

: Series - 1차원 데이터, DataFrame - 2차원 데이터

DataFrame = Series + Series 

  • Series : List와 다르게 index를 직접 지정할 수 있다. 설정을 안 해주면 0, 1, 2...로 설정됨.
  • DataFrame : 인덱스와 컬럼을 기준으로 표 형태처럼 데이터를 저장.

 

 

▼ DataFrame 생성해 보기!

import pandas as pd

student_list = [['철수', 100, 90, 85], ['영희', 70, 80, 85], ['진구', 95, 75, 80]]

df = pd.DataFrame(student_list)
df

출력결과 - 기본 0,1,2,...로 설정됨.

 

 

columns와 index를 직접 설정해줬을 때,

 

 

 

columns와 index를 조회해 보고, dtype으로 DataFrame의 자료형을 조회해 보면

numpy와 다르게 문자형, 숫자형 다양한 자료형의 값들을 정상적으로 출력해 준다는 점을 확인할 수 있다 !

단, 같은 컬럼에서는 같은 자료형을 사용해야 된다 !!! (주의 )

 

 

 

< pandas의 dtype >

  • int64 : 정수
  • float64 : 소수
  • object : 텍스트
  • bool : 불린(참, 거짓)
  • datetime64 : 날짜와 시간
  • category : 카테고리

 

▼ 데이터 타입 변경

     .astype('데이터타입' 

size.astype('float')              // 데이터 타입 변경
size.astype({'콩다' : 'float'})   // 특정 컬럼에 대해서 데이터 타입 변경

 

 

728x90
반응형

댓글