点击文末原文链接,即可查看详细解析
1.在构建一个决策树模型时,我们对某个属性分割节点,下面四张图中,哪个属性对应的信息增益最大?
A.outlook B.humidity C.windy D.temperature
答案:A
2.如果回归模型中存在多重共线性(multicollinearity),应该如何解决这一问题而不丢失太多信息?
①. 剔除所有的共线性变量
②. 剔除共线性变量中的一个
③. 通过计算方差膨胀因子(Variance Inflation Factor,VIF)来检查共线性程度,并采取相应措施
④. 删除相关变量可能会有信息损失,我们可以不删除相关变量,而使用一些正则化方法来解决多重共线性问题,例如 Ridge 或 Lasso 回归。
A.①③ B.②③④ C.①③④ D.②④
答案:B
3."监督式学习中存在过拟合,而对于非监督式学习来说,没有过拟合",这句话是否正确?
A.正确 B.错误
答案:B
4.逻辑回归与多元回归分析有哪些不同之处?
A.逻辑回归用来预测事件发生的概率
B.逻辑回归用来计算拟合优度指数
C.逻辑回归用来对回归系数进行估计
D.以上都是
答案:D
5.在一个简单的线性回归模型中(只有一个变量),如果将输入变量改变一个单位(增加或减少),那么输出将改变多少?
A.一个单位 B.不变 C.截距 D.回归模型的尺度因子
答案:D
6.在 n 维空间中(n > 1),下列哪种方法最适合用来检测异常值?
A.正态概率图 B.箱形图 C.散点图 D.马氏距离
答案:D
7.下图是两个不同 β0、β1 对应的逻辑回归模型(绿色和黑色):
关于两个逻辑回归模型中的 β0、β1 值,下列说法正确的是?
注意:y= β0 β1*x, β0 是截距,β1 是权重系数。
A.绿色模型的 β1 比黑色模型的 β1 大
B.绿色模型的 β1 比黑色模型的 β1 小
C.两个模型的 β1 相同
D.以上说法都不对
答案:B
8.假如我们利用 Y 是 X 的 3 阶多项式产生一些数据(3 阶多项式能很好地拟合数据)。那么,下列说法正确的是?
① 简单的线性回归容易造成高偏差(bias)、低方差(variance)
② 简单的线性回归容易造成低偏差(bias)、高方差(variance)
③ 3 阶多项式拟合会造成低偏差(bias)、高方差(variance)
④ 3 阶多项式拟合具备低偏差(bias)、低方差(variance)
A.①③ B.①④ C.②③ D.②④
答案:B