
[ resample() 메소드의 시간 단위 구간 설정 ]
살짝 참고만 하면 좋다.
- 5분 단위 구간 : resample('5T')
- 10분 단위 구간 : resample('10T')
- 20분 단위 구간 : resample('20T')
- 1시간 단위 구간 : resample('1H')
- 1일 단위 구간 : resample('1D')
- 1주일 단위 구각 : resample('1W')
- 1달 단위 구간 : resample('1M')
- 1년 단위 구간 : resample('1Y')
# resample 'Y' 는 년도다. 년도로 리샘플한 후, 각 년도별 몇개의 범죄 데이터를 가지고 있는지 확인한다.
in : df_year.chicago_df.resample('YS').size
YS ( year start )= 년도의 시작
resample함수 =
'python pandas resample' = 시간간격 재조정 / 구글에 검색하면 잘 나온다.
# 위의 데이터를 plot 으로 시각화 한다. 범죄횟수를 눈으로 확인하자.
첫번째방법
in : plt.plot(df_year)
plt.show()
그럼 차트가 나온다.
2번째 방법
in : df_year.plot(
plt.show()
그럼 차트가 나온다.
# 월별 범죄 발생 건수를 확인하자.
chicago_df.resample('M').size()
df_month로 변수를 만든다.
df_month = chicago_df.resample('M').size()
다음은 차트그리기.
# 월별 범죄 발생 건수도 plot 으로 시각화 하자.
df.month.plot()
plt.show()
차트가 나온다.
월별이기에 연도보다 좀 더 디테일한 그래프가 그려진다.
# 월별 범죄 발생 건수도 plot 으로 시각화 하자.
# 분기별 범죄 건수도 확인하자.
chicago_df.resample('Q').size()
변수로 저장한다.
df_q = chicago_df.resample('Q').size()
여기서 df_q 는 쿼터(분기별)를 의미한다.
# 분기별 범죄 건수도 시각화 하자.
df_q.plot()
그래프가 나온다.
시간단위별,일단위,연단위 할때 = resample 함수를 사용한다.
월별로(매달 말일) 주기로 하여 데이터프레임을 만들고, 인덱스를 리셋하시오.
chicago_df.resample('M').size()
여기에 chicago_prophet 변수를 더해준다.
chicago_prophet = chicago_df.resample('M').size()
인덱스를 리셋하고,
프로펫 라이브러리를 사용하려면, 날짜 컬럼은 'ds' 로, 예측하려는 수치는 'y'로 바꿔야 합니다(필수).
1. 인덱스를 리셋한다.
chicago_prophet.reset_index()
이걸 다시 변수로 저장한다.
chicago_prophet = chicago_prophet.reset_index()
예측하려는 수치는 'y'로 바꿔야 한다.
chicago_prophet.columns= ['ds', 'y']
# 36개월로 해서 예측해보자.
prophet.make_future.dataframe(periods=36, freq='M')
future (변수 추가) = prophet.make_future.dataframe(periods=36, freq='M')
forecast =prophet.predict(future)
prophet.plot(forecast)pit.savefig('char_11.jpg')
prophet.plot.comonent(forecast)
plt.savefig('char_11.jpg')
'Python > Machine Learning' 카테고리의 다른 글
Machine Learning : 문자열 데이터를 숫자로 바꿔주는 CountVectorizer와 analyzer파라미터 (0) | 2022.05.10 |
---|---|
Machine Learning : Hierarchical Clusting의 Dendrogram 설명 (0) | 2022.05.09 |
Machine Learning : K-means 의 WCSS와 Elbow Method 설명 (0) | 2022.05.09 |
Machine Learning : WordCloud 라이브러리 사용법과 Stopwords 적용하는 방법 (0) | 2022.05.09 |
Machine Learning : Hierarchical Clustering (0) | 2022.05.09 |