본문 바로가기

Python/Machine Learning

python pandas resample

 

 

 

[ resample() 메소드의 시간 단위 구간 설정 ]

살짝 참고만 하면 좋다.

- 5분 단위 구간    : resample('5T')

- 10분 단위 구간  : resample('10T')

- 20분 단위 구간 : resample('20T')

- 1시간 단위 구간 : resample('1H')

- 1일 단위 구간    : resample('1D')

- 1주일 단위 구각 : resample('1W')

- 1달 단위 구간    : resample('1M')

- 1년 단위 구간    : resample('1Y')


# resample  'Y' 는 년도다. 년도로 리샘플한 후, 각 년도별 몇개의 범죄 데이터를 가지고 있는지 확인한다.

in : df_year.chicago_df.resample('YS').size

YS ( year start )= 년도의 시작

resample함수 = 

'python pandas resample' = 시간간격 재조정 / 구글에 검색하면 잘 나온다.

 

# 위의 데이터를 plot 으로 시각화 한다. 범죄횟수를 눈으로 확인하자.

 

첫번째방법
in : plt.plot(df_year)
     plt.show()
 
그럼 차트가 나온다.
 
2번째 방법
in : df_year.plot(
plt.show()
 
그럼 차트가 나온다.
 
 
 

# 월별 범죄 발생 건수를 확인하자.

 
chicago_df.resample('M').size()
df_month로 변수를 만든다.
 
df_month = chicago_df.resample('M').size()
 
다음은 차트그리기.
 
 
 

# 월별 범죄 발생 건수도 plot 으로 시각화 하자.

 
df.month.plot()
plt.show()
 
차트가 나온다.
월별이기에 연도보다 좀 더 디테일한 그래프가 그려진다.

# 월별 범죄 발생 건수도 plot 으로 시각화 하자.

 
 
 
 

# 분기별 범죄 건수도 확인하자.

 
chicago_df.resample('Q').size()
 
변수로 저장한다.
 
df_q = chicago_df.resample('Q').size()
여기서 df_q 는 쿼터(분기별)를 의미한다.
 
 
 

# 분기별 범죄 건수도 시각화 하자.

df_q.plot()
 
그래프가 나온다.
 
 

시간단위별,일단위,연단위 할때 = resample 함수를 사용한다.


월별로(매달 말일) 주기로 하여 데이터프레임을 만들고, 인덱스를 리셋하시오.

chicago_df.resample('M').size()

여기에 chicago_prophet  변수를 더해준다.

chicago_prophet = chicago_df.resample('M').size()

 


인덱스를 리셋하고,

프로펫 라이브러리를 사용하려면, 날짜 컬럼은 'ds' 로, 예측하려는 수치는 'y'로 바꿔야 합니다(필수).

 

1. 인덱스를 리셋한다.

chicago_prophet.reset_index()

이걸 다시 변수로 저장한다.

chicago_prophet = chicago_prophet.reset_index()

 

예측하려는 수치는 'y'로 바꿔야 한다.

chicago_prophet.columns= ['ds', 'y']


# 36개월로 해서 예측해보자.

prophet.make_future.dataframe(periods=36, freq='M')

future (변수 추가) = prophet.make_future.dataframe(periods=36, freq='M')

forecast =prophet.predict(future)

prophet.plot(forecast)pit.savefig('char_11.jpg')

 

 

 

prophet.plot.comonent(forecast)

plt.savefig('char_11.jpg')