最新公告
  • 欢迎您光临起源地模板网,本站秉承服务宗旨 履行“站长”责任,销售只是起点 服务永无止境!立即加入钻石VIP
  • python如何做时间序列

    正文概述    2020-09-11   305

    python做时间序列的方法:首先导入需要的工具包,输入“data.plot()”,“plt().show()”命令绘制时序图;然后由acf,pacf判断模型参数即可。

    python如何做时间序列

    采用python进行简易的时间序列预测流程

    时间序列可视化——>序列平稳——>acf,pacf寻找最优参——>建立模型——>模型检验——>模型预测

    涉及到的工具包如下:

    # -*- coding:utf-8 -*-
    import pandas as pd
    import numpy as np
    import matplotlib.pyplot as plt
    from random import randrange
    from statsmodels.graphics.tsaplots import plot_acf, plot_pacf
    from statsmodels.tsa.arima_model import ARIMA
    from statsmodels.api import tsa原始数据

    时间序列是与时间相关的一组数据,这里的数据主要是生成的模拟数据,仅是为了练习一下处理【时间序列】的流程。

    def generate_data(start_date, end_date):
        df = pd.DataFrame([300 + i * 30 + randrange(50) for i in range(31)], columns=['income'],
                          index=pd.date_range(start_date, end_date, freq='D'))
     
        return df
     
     
    data = generate_data('20170601', '20170701')
    # 这里要将数据类型转换为‘float64’
    data['income'] = data['income'].astype('float64')

     

    数据可视化

    这里主要是观察数据是否是平稳序列,如果不是则要进行处理转换为平稳序列1

    # 绘制时序图

    data.plot()
    plt.show()

    # 绘制自相关图

    plot_acf(data).show()

    python如何做时间序列

     

    从时序图中可以看出这组序列存在明显的增长趋势。不是平稳序列

     python如何做时间序列

     

    acf图呈现出三角对称趋势,进一步说明这组时间序列是一组单调趋势的非平稳序列。

    差分–转换为平稳序列

    # 差分运算

    # 默认1阶差分

    data_diff = data.diff()

     

    # 差分后需要排空,

    data_diff = data_diff.dropna()
    
    data_diff.plot()
    plt.show()

    python如何做时间序列

     

     

    可以看到在1阶差分后序列已经转换为平稳序列。

    由acf,pacf判断模型参数

    plot_acf(data_diff).show()
    plot_pacf(data_diff).show()

    python如何做时间序列

    python如何做时间序列

     

    这里选用ARIMA模型,参数为(1, 1, 1)

    模型训练

    arima = ARIMA(data, order=(1, 1, 1))
    result = arima.fit(disp=False)
    print(result.aic, result.bic, result.hqic)
     
    plt.plot(data_diff)
    plt.plot(result.fittedvalues, color='red')
    plt.title('ARIMA RSS: %.4f' % sum(result.fittedvalues - data_diff['income']) ** 2)
    plt.show()

    python如何做时间序列

     

     

    模型检验

    这里选择了 ‘Ljung-Box检验’,

    # ARIMA   Ljung-Box检验 -----模型显著性检验,Prod> 0.05,说明该模型适合样本

    resid = result.resid
    r, q, p = tsa.acf(resid.values.squeeze(), qstat=True)
    print(len(r), len(q), len(p))
    test_data = np.c_[range(1, 30), r[1:], q, p]
    table = pd.DataFrame(test_data, columns=['lag', 'AC', 'Q', 'Prob(>Q)'])
    print(table.set_index('lag'))

     

    检验的结果就是看最后一列前十二行的检验概率(一般观察滞后1~12阶),如果检验概率小于给定的显著性水平,比如0.05、0.10等就拒绝原假设,其原假设是相关系数为零。就结果来看,如果取显著性水平为0.05,那么相关系数与零没有显著差异,即为白噪声序列。

     python如何做时间序列

     

    模型预测

    # 模型预测

    pred = result.predict('20170701', '20170710', typ='levels')
    print(pred)
    x = pd.date_range('20170601', '20170705')
    plt.plot(x[:31], data['income'])
    # lenth = len()
    plt.plot(pred)
    plt.show()
    print('end')

    python如何做时间序列

    python如何做时间序列

    推荐课程:零基础入门学习Python(小甲鱼)


    起源地下载网 » python如何做时间序列

    常见问题FAQ

    免费下载或者VIP会员专享资源能否直接商用?
    本站所有资源版权均属于原作者所有,这里所提供资源均只能用于参考学习用,请勿直接商用。若由于商用引起版权纠纷,一切责任均由使用者承担。更多说明请参考 VIP介绍。
    提示下载完但解压或打开不了?
    最常见的情况是下载不完整: 可对比下载完压缩包的与网盘上的容量,若小于网盘提示的容量则是这个原因。这是浏览器下载的bug,建议用百度网盘软件或迅雷下载。若排除这种情况,可在对应资源底部留言,或 联络我们.。
    找不到素材资源介绍文章里的示例图片?
    对于PPT,KEY,Mockups,APP,网页模版等类型的素材,文章内用于介绍的图片通常并不包含在对应可供下载素材包内。这些相关商业图片需另外购买,且本站不负责(也没有办法)找到出处。 同样地一些字体文件也是这种情况,但部分素材会在素材包内有一份字体下载链接清单。
    模板不会安装或需要功能定制以及二次开发?
    请QQ联系我们

    发表评论

    还没有评论,快来抢沙发吧!

    如需帝国cms功能定制以及二次开发请联系我们

    联系作者

    请选择支付方式

    ×
    迅虎支付宝
    迅虎微信
    支付宝当面付
    余额支付
    ×
    微信扫码支付 0 元