如何解读更全面的测试结果?全面、结果、测试

2023-09-03 14:13:30 作者:幸福向左,我向右

我正在努力理解p值的概念和adfuler检验的其他各种结果。

我使用的代码:

一个案例教会你 全面的数据分析应该怎么做

(我在堆栈溢出中找到此代码)

import numpy as np
import os
import pandas as pd
import statsmodels.api as sm
import cython

import statsmodels.tsa.stattools as ts

loc = r"C:Stock StudyStock ResearchHist Data"
os.chdir(loc)
xl_file1 = pd.ExcelFile("HDFCBANK.xlsx")
xl_file2 = pd.ExcelFile("KOTAKBANK.xlsx")
y1 = xl_file1.parse("Sheet1")
x1 = xl_file2.parse("Sheet1")

x = x1['Close']
y = y1['Close']


def cointegration_test(y, x):
    # Step 1: regress on variable on the other
    ols_result = sm.OLS(y, x).fit()
    # Step 2: obtain the residual (ols_resuld.resid)
    # Step 3: apply Augmented Dickey-Fuller test to see whether
    #        the residual is unit root
    return ts.adfuller(ols_result.resid)

输出:

(-1.8481210964862593, 0.35684591783869046, 0, 1954, {'10%': -2.5675580437891359, '1%': -3.4337010293693235, '5%': -2.863020285222162}, 21029.870846458849)

如果我对测试的理解正确:

值 adf:Float 测试统计 pvalue:Float 基于Mackinnon(1994,2010)的MacKinnon近似p值 已使用延迟:int 使用的LAG数 nobs:int 用于ADF回归的观测值数量和临界值的计算 临界值:DICT 测试统计的1%、5%和10%级别的临界值。基于麦金农(2010) ICBEST:FLOAT 如果autolag不为None,则为最大化信息条件。 resstore:ResultStore,可选

我不能完全理解结果,希望有人愿意用外行的语言解释一下。我发现的所有解释都非常技术性。

我的解释是:它们是协整的,即我们未能反驳零假设(即单位根存在)。置信度是%数字。

我完全错了吗?

推荐答案

您在问题中的陈述是正确的。一旦你将Adfuller检验应用于你的OLS回归残差,你就是在检查你的残差是否具有任何异方差,换句话说,你的残差是否是静止的。

由于您较成熟的p值低于某个指定的Alpha(即:5%),因此您可以拒绝零假设(Ho),因为仅凭运气(随机机会)获得p值的概率非常低。

一旦HO被拒绝,可以接受替代假设(Ha),在这种情况下将是:残基序列是稳定的。

以下是您的假设关系:

Ho:序列不是平稳的,它呈现出异方差。换句话说,你的残数取决于它本身(即:yt取决于yt-1,yt-1取决于yt-2,依此类推)

Ha:序列是平稳的(这通常是我们在回归分析中所希望的)。不需要再做任何事情。