F检验法: F检验用于对所有的自变量X在整体上看对于Y的线性显著。对于F-statistic的值,当响应变量和预测变量之间没有关系时,F统计量的值趋近于1。 当然,也可以用P-value判断显著性判断是否拒绝零假设,小于0.01更小时说明整体上自变量与Y相关关系显著。
残差QQ图(normal Q-Q),用来描述残差是否符合正态分布。如果我们正确的构建了回归分析模型,那么模型的残差会符合完美的正态分布;对于近似服从正态分布的标准化残差,应该有 95% 的样本点落在 [-2,2] 区间内。异常值已经被标出。
对标准化残差和杠杆值图(Residuals vs leverage),虚线表示的cooks距离等高线用来度量的回归影响点。如果出现红色的等高线,则说明数据中有特别影响回归结果的异常点。异常值已经被标出。
R平方是X和Y之间的线性关系的度量,而相关性分析也是度量X和Y之间的线性关系的方法,因此R平方统计量和相关性分析的r有相同的作用。事实上,在简单的线性回归中,R平方 是等于 r平方。换句话说,在简单的线性回归中,可以用相关性的r平方来代替线统计量。但,在多元线性回归中,回归的概念无法与相关的概念互通,因此多元回归中的线性关系度量只能用R平方。