2. 데이터 확인하기 (Viewing Data)
.columns.index.T.valuedescribe()head()pandassortsort_indexsort_valuetail()Transpose
DataFrame에 들어있는 자료들을 확인하기 메서드를 몇 가지 살펴보도록 하겠습니다.
head(), tail()
DataFrame의 첫 부분, 마지막 부분의 데이터를 보고싶을 때 사용하는 메서드입니다. 파라미터로 숫자를 넣으면 해당 숫자만큼의 데이터가 출력됩니다.
import pandas as pd
import numpy as np
dates = pd.date_range('20130101', periods=6)
df = pd.DataFrame(np.random.randn(6, 4), index=dates, columns=list('ABCD'))
print('\n')
print(df.head(5))
print('\n')
print(df.tail(3))
.index / .columns / .value
DataFrame의 행를 보려면 .index
를, 열을 보려면 .column
, numpy 데이터를 보려면 .value
속성을 통해 확인하면 됩니다.
print('\n')
print(df.index)
print('\n')
print(df.columns)
print('\n')
print(df.values)
describe()
DataFrame에 대한 간단한 통계 정보를 출력합니다.
- 컬럼별 데이터 개수(Count)
- 데이터 평균 값(Mean)
- 표준편차 (Standard)
- 최소값 (Minimum)
- 최대값 (Maximum)
- 4분위수(Quantile / 25%, 50%, 75%)
.T (Transpose)
.T
속성은 DataFrame에서 행과 열을 바꾼 형태의 DataFrame을 출력합니다.
sort_index() / sort_value()
sort_index()
행과 열 이름을 정렬하여 나타낼 수 있습니다. 정렬할 대상 축을 결정할 때에는 axis
파라미터를 이용합니다. axis = 0
은 행를 기준(행)으로, axis = 1
컬럼을 기준으로 정렬하겠다는 뜻입니다. 정렬의 방향은 ascending
파라미터를 사용합니다. ascending = True
는 오름차순, ascending = False
는 내림차순을 의미합니다.
axis
- axis = 0 # 행 기준 정렬
- axis = 1 # 열 기준 정렬
ascending
- ascending = True # 오름차순 정렬
- ascending = False # 내림차순 정렬
sort_value()
DataFrame 내부에 있는 값으로 정렬할 수 있습니다.
print(df.sort_index(axis = 1, ascending = False))
print(df.sort_value(by = 'B', ascending = True))