Data/Data Analysis
2020. 3. 30.
[Pandas] Dataframe resample 함수
시계열 데이터를 처리할 때 일정시간 간격이 벌어져있을때 upsampling, downsampling 기법을 이용하여 데이터를 늘리거나 줄인다. 이러한 방법은 pandas.Dataframe에서 resample함수를 이용하여 작업한다. 일단 해당 작업은 index가 datetime형식이여야 지원이 가능하다. 두가지 방법이있는데 다 알아보자 1. 복잡하지만 자세하게 세팅이 가능한 방법 먼저 데이터를 불러읽은다음에 info함수를 사용하여 column들의 정보를 빼온다. 현재 timestamp column은 string 형식이고 index가 아니기때문에 resample 함수를 쓸수가없음 따라서 다음과 같이 datetime으로 변환을 하고, 다시 info함수를 쓰면, 기존의 timestamp column이 date..