回归怎么控制行业因素?
在实际应用中,自变量中可能包含大量变量,不可能对所有自变量进行回归分析,这就需要对自变量进行选择。自变量选择的主要目的是找出对因变量影响显著的变量,剔除那些对因变量影响不显著的变量。一般来讲,对自变量选择时,尽可能把那些对因变量有实际意义的变量在回归方程中予以保留,对那些没有实际意义的变量要剔除,以使回归方程能更准确地体现所研究问题的规律,同时使方程本身具有更合理的经济解释性。
在回归分析中,主要的变量选择方法包括全回归、前进法、后退法、逐步回归法、最优子集法。前进法、后退法和逐步回归法都是最优子集法的近似,只是最优子集法更精确一些。最优子集法在所有可能的自变量子集生成回归方程,然后从中选最佳方程,一般用判定系数R2、F测验的概率prob(F)、赤池信息标准AIC和施瓦茨贝叶斯准则SC等统计量作为选优准则,在子集个数较少(最多包含10个变量)时,最优子集法是最好的选择变量方法,但是在子集个数过多时,计算机将无法处理如此多的回归方程,此时可以选择逐步回归法。