Панды | Основы манипуляции с временными рядами

Опубликовано: 27 Марта, 2022

Хотя временные ряды также доступны в scikit-learn, но у Pandas есть некоторые дополнительные функции. В этом модуле Pandas мы можем включать дату и время для каждой записи и можем извлекать записи из фрейма данных. Мы можем узнать данные в определенном диапазоне даты и времени, используя модуль pandas с именем Time series . Давайте обсудим некоторые основные цели, чтобы представить анализ временных рядов pandas.

Цели анализа временных рядов

  • Создайте серию свиданий
  • Работа с отметкой времени данных
  • Преобразование строковых данных в метку времени
  • Нарезка данных с использованием отметки времени
  • Выполните повторную выборку временных рядов для различных агрегатов / сводных статистических данных за разные периоды времени.
  • Работа с недостающими данными

Теперь давайте проведем практический анализ некоторых данных, чтобы продемонстрировать использование временных рядов панд.

Code #1:

import pandas as pd
from datetime import datetime
import numpy as np
  
range_date = pd.date_range(start ="1/1/2019", end ="1/08/2019"
                                                   freq ="Min")
print(range_date)
Output:

DatetimeIndex(["2019-01-01 00:00:00", "2019-01-01 00:01:00",
               "2019-01-01 00:02:00", "2019-01-01 00:03:00",
               "2019-01-01 00:04:00", "2019-01-01 00:05:00",
               "2019-01-01 00:06:00", "2019-01-01 00:07:00",
               "2019-01-01 00:08:00", "2019-01-01 00:09:00",
               ...
               "2019-01-07 23:51:00", "2019-01-07 23:52:00",
               "2019-01-07 23:53:00", "2019-01-07 23:54:00",
               "2019-01-07 23:55:00", "2019-01-07 23:56:00",
               "2019-01-07 23:57:00", "2019-01-07 23:58:00",
               "2019-01-07 23:59:00", "2019-01-08 00:00:00"],
              dtype="datetime64[ns]", length=10081, freq="T")