本项目运用ARIMA、XGBoost及RNN模型结合MATLAB进行时间序列分析,专注于个人家庭电力消耗的精准预测。
ARIMA模型的MATLAB代码用于个人家庭电力的时间序列预测。数据集收集时间为2006年12月至2010年11月(共47个月),采样率为每分钟一次。六个自变量包括电量和子计量值,一个数值因变量为全球有功功率,共有2,075,259个观测值可用。目标是预测未来的全球有功功率。
为了简化处理过程,删除了缺失数据,并且注意到并非所有观察都按日期时间排序。因此,在分析过程中使用显式的时间戳作为索引来组织数据。在预处理步骤中,对原始数据进行了桶平均操作以减少一分钟采样率带来的噪声影响。出于简化的考虑,我们仅关注原始数据集的最后18000行(即2010年11月的数据)。
相关文件包括:
- Gpower_Arima_Main.py:用于执行单变量ARIMA模型的可运行Python程序。
- myArima.py:实现了一些关于ARIMA模型的方法和函数。
- Gpower_Xgb_Main.py:基于树的模型(XGBoost)的可执行Python程序。
- myXgb.py:实现了几个与XGBoost模型相关的函数。
- lstm_Main.py: 用于LSTM模型的主要代码文件。