标准回归系数是怎么算出来的？

2024-05-18 23:50

1. 标准回归系数是怎么算出来的？

rss/(n-k) 这是庞皓版教材的计算公式(根据eviews软件回归结果）
S.E.= (∑e^2∕(n-k-1) )^(1/2)
回归标准差反映的是各变量值与其平均数的平均差异程度，表明其平均数对各变量值的代表性强弱；公式：各变量值与其平均数的差的平方和再求平均数，是方差，方差开平方就是标准差。
SE of regression 是标准误，其计算公式为RSS除以（n-k）(n为自由变量个数10,k为3) 再开根号.
RSS是残差平方和即Sum squared resid=342.5486
由此内可得标准容误为6.9954

扩展资料：
标准化回归系数说的重要性则与上面前提中所说的意义不同，这是一种相对的重要性，与某种情况下，自变量间的离散程度有关。
标准化回归系数的比较结果只是适用于某一特定环境的，而不是绝对正确的，它可能因时因地而变化。举例来说，从某一次数据中得出，在影响人格形成的因素中，环境因素的Beta值比遗传因素的Beta值大，这只能说明数据采集当时当地的情况，而不能加以任何不恰当的推论，不能绝对地不加任何限定地说，环境因素的影响就是比遗传因素大。事实上，如果未来环境因素的波动程度变小，很可能遗传因素就显得更为重要。
参考资料来源：百度百科-标准回归系数

标准回归系数是怎么算出来的？

2. 回归系数置信区间公式

你好，以下是我整理的均值的置信区间的资料
线性回归中，我们假定，对于每一特定的x值，其对应的y值应该是来自一个服从某一均值和标准差的分布。例如，调查温度与手足口发病率的关系，温度=10℃，假定其对应的手足口发病率是来自一个服从均值为10（1/10万），标准差为4（1/10万）的总体分布。
当我们调查这一数据时，得到的是这一总体分布中的某一随机数值（所以说y是随机变量）。根据样本数据建立的回归方程，可以估计出当x等于某一数值时，y的估计值（也就是y的总体均值的估计值）。比如根据方程式：
发病率=-0.011+0.995*温度
可以估计出，温度=10℃时，对应的手足口发病率的均值估计为9.94（1/10万）。
由于是总体均值的估计，那就必然会有估计的误差（标准误），这一标准误是可以计算出来的（公式略，格式不好调整，感兴趣的等本书出版后看书）。
因此根据标准误、均值估计值，便可以估计置信区间。这一置信区间反映的是样本估计yi的均值的这一范围有多大的信心包含了总体均值。
如月份温度=10℃时，手足口发病率均值的95%置信区间为（6.64,16.25）。这说明，对于温度=10℃这样的月份，我们有95%的信心认为，（6.64,16.25）这一区间包含了手足口发病率的总体均值。其暗含的意思就是（尽管不是很严谨），有95%的信心认为，对于温度=10℃的所有月份，它们对应的手足口发病率的均值在（6.64,16.25）之间。这句话虽然不是很严谨，但其隐含的意思其实就是如此。

3. 回归分析的时候，如果R方较大有90%以上，但是各变量求出的系数置信区间较大

　　这个问题描述得不够详细。
　　首先，你采用的是什么数据？如果是时间序列，那么有没有考虑序列的平稳性和协整性？只有协整的序列拿来做简单回归，系数才有意义。如果不协整，即便R方很大，也是为回归，系数没有意义。若是截面数据则另当别论。
　　其次，你说“各个变量”，推断你是用了多元回归。这里，多元回归的变量中全部系数的t检验都通过了吗？如果都通过，那么，这样的置信区间并无不合理之处。至于你觉得置信区间偏大，可能是由于你的变量本身有量纲，或者它相对于被解释变量的数量级偏小。因此，即便乘上系数，其值对被解释变量的值的影响也不大。若只是部分变量的t检验通过，则需要考虑多重共线性的问题。
　　希望能解答你的疑问，祝好。

回归分析的时候，如果R方较大有90%以上，但是各变量求出的系数置信区间较大

4. 已知95%置信区间和平均值，如何求标准差

95%置信区间的公式是(X-1.96*σ/sqrt(n), X+1.96*σ/sqrt(n)), 其中σ是标准差, n是样本容量, X是随机变量。这里X即是平均值, 代入计算即可。

5. 标准回归系数怎么求？

rss/(n-k) 这是庞皓版教材的计算公式(根据eviews软件回归结果）
S.E.= (∑e^2∕(n-k-1) )^(1/2)
回归标准差反映的是各变量值与其平均数的平均差异程度，表明其平均数对各变量值的代表性强弱；公式：各变量值与其平均数的差的平方和再求平均数，是方差，方差开平方就是标准差。
SE of regression 是标准误，其计算公式为RSS除以（n-k）(n为自由变量个数10,k为3) 再开根号。
RSS是残差平方和即Sum squared resid=342.5486。
由此内可得标准容误为6.9954


前提
标准化回归系数（Beta值）在多元回归中被用来比较变量间的重要性，但是由于重要性这一词意义的含糊性，这一统计常被误用。
有时人们说重要性，是指同样的条件下，哪一个东西更有效。在提高教学质量上，是硬件条件更重要还是师资更重要？如果是师资更重要，那么同样的物力投在师资上就可以更快地提高教学质量。但是这里要比较的两者必须有同样的测量单位，如成本（元）。
如果变量的单位不同，我们不能绝对地说哪个变量更重要。不同单位的两个东西是不能绝对地比出高低轻重来。要想进行绝对地比较，就需要两个东西有着共同的测度单位，否则无法比较。
以上内容参考来源：百度百科-标准回归系数

标准回归系数怎么求？

6. 什么是偏回归系数，它与简单线性回归的回归系数有什么不同

7. 已知标准差a和均值b，如何得出95% 置信区间

95％置信区间，均值X加减两个标准差，即信赖区间{X-2S，X+2S}
95%置信区间：[b－1.96SE，b＋1.96SE]
99%置信区间：[b－2.58SE，b＋2.58SE]
数据平局值为A
数据的标准差为B
置信区间=A+-B*1.96/数据数量的平方根
再细节的您看EXCEL的公式即可。

置信区间的常用计算方法如下：
Pr(c1<=μ<=c2)=1-α
其中：α是显著性水平（例：0.05或0.10）；
Pr表示概率，是单词probability的缩写；
100%*(1-α)或(1-α)或指置信水平（例如：95%或0.95）；
表达方式：interval(c1,c2) - 置信区间。

以上内容参考：百度百科-置信区间

已知标准差a和均值b，如何得出95% 置信区间

8. 已知总体均值X和标准差S，怎样求95%置信区间

95％置信区间 均值X加减两个标准差 即信赖区间{X-2S，X+2S}
99％置信区间 均值X加减3个标准差 即信赖区间{X-3S，X+3S}