??斗地主捕鱼电竞提现秒到 广告位招租 - 15元/月全站展示
??支付宝搜索579087183领大额红包 ??伍彩集团官网直营彩票
??好待遇→招代理 ??伍彩集团官网直营彩票
??络茄网 广告位招租 - 15元/月全站展示
BAT机器学习面试1000题系列(第206 210题)

转载   2017-12-01   浏览量:73



207.下列不是SVM核函数的是:
  A.多项式核函数
  B.logistic核函数
  C.径向基核函数
  D.Sigmoid核函数

  正确答案:B
  @刘炫320,本题题目及解析来源://blog.csdn.net/column/details/16442.html 
  SVM核函数包括线性核函数、多项式核函数、径向基核函数、高斯核函数、幂指数核函数、拉普拉斯核函数、ANOVA核函数、二次有理核函数、多元二次核函数、逆多元二次核函数以及Sigmoid核函数.
  核函数的定义并不困难,根据泛函的有关理论,只要一种函数 K ( x i , x j ) 满足Mercer条件,它就对应某一变换空间的内积.对于判断哪些函数是核函数到目前为止也取得了重要的突破,得到Mercer定理和以下常用的核函数类型:
  (1)线性核函数 :K ( x , x i ) = x ? x i
  (2)多项式核 :K ( x , x i ) = ( ( x ? x i ) + 1 ) d
  (3)径向基核(RBF):K ( x , x i ) = exp ( ? ∥ x ? x i ∥ 2 σ 2 ) 
  Gauss径向基函数则是局部性强的核函数,其外推能力随着参数 σ 的增大而减弱。多项式形式的核函数具有良好的全局性质。局部性较差。
  (4)傅里叶核 :K ( x , x i ) = 1 ? q 2 2 ( 1 ? 2 q cos ( x ? x i ) + q 2 )
  (5)样条核 :K ( x , x i ) = B 2 n + 1 ( x ? x i )
  (6)Sigmoid核函数 :K ( x , x i ) = tanh ( κ ( x , x i ) ? δ )
  采用Sigmoid函数作为核函数时,支持向量机实现的就是一种多层感知器神经网络,应用SVM方法,隐含层节点数目(它确定神经网络的结构)、隐含层节点对输入节点的权值都是在设计(训练)的过程中自动确定的。而且支持向量机的理论基础决定了它最终求得的是全局最优值而不是局部最小值,也保证了它对于未知样本的良好泛化能力而不会出现过学习现象。
  在选取核函数解决实际问题时,通常采用的方法有:
  一是利用专家的先验知识预先选定核函数;
  二是采用Cross-Validation方法,即在进行核函数选取时,分别试用不同的核函数,归纳误差最小的核函数就是最好的核函数.如针对傅立叶核、RBF核,结合信号处理问题中的函数回归问题,通过仿真实验,对比分析了在相同数据条件下,采用傅立叶核的SVM要比采用RBF核的SVM误差小很多.
  三是采用由Smits等人提出的混合核函数方法,该方法较之前两者是目前选取核函数的主流方法,也是关于如何构造核函数的又一开创性的工作.将不同的核函数结合起来后会有更好的特性,这是混合核函数方法的基本思想.

彩票开奖查询 www.kbyp.net

208.已知一组数据的协方差矩阵P,下面关于主分量说法错误的是()
  A.主分量分析的最佳准则是对一组数据进行按一组正交基分解, 在只取相同数量分量的条件下,以均方误差计算截尾误差最小
  B.在经主分量分解后,协方差矩阵成为对角矩阵
  C.主分量分析就是K-L变换
  D.主分量是通过求协方差矩阵的特征值得到

  正确答案:C
  解析:K-L变换与PCA变换是不同的概念,PCA的变换矩阵是协方差矩阵,K-L变换的变换矩阵可以有很多种(二阶矩阵、协方差矩阵、总类内离散度矩阵等等)。当K-L变换矩阵为协方差矩阵时,等同于PCA。


209.在分类问题中,我们经?;嵊龅秸貉臼萘坎坏鹊那榭?比如正样本为10w条数据,负样本只有1w条数据,以下最合适的处理方法是()
  A.将负样本重复10次,生成10w样本量,打乱顺序参与分类
  B.直接进行分类,可以最大限度利用数据
  C.从10w正样本中随机抽取1w参与分类
  D.将负样本每个权重设置为10,正样本权重为1,参与训练过程

  正确答案:ACD
  解析:1. 重采样。 A可视作重采样的变形。改变数据分布消除不平衡,可能导致过拟合。 
  2. 欠采样。 C的方案 提高少数类的分类性能,可能丢失多数类的重要信息。 
  如果1:10算是均匀的话,可以将多数类分割成为1000份。然后将每一份跟少数类的样本组合进行训练得到分类器。而后将这1000个分类器用assemble的方法组合位一个分类器。A选项可以看作此方式,因而相对比较合理。 
  另:如果目标是 预测的分布 跟训练的分布一致,那就加大对分布不一致的惩罚系数。 
  3. 权值调整。 D方案也是其中一种方式。
当然,这只是在数据集上进行相应的处理,在算法上也有相应的处理方法。


210.在统计模式识分类问题中,当先验概率未知时,可以使用()?

  A.最小损失准则

  B.N-P判决

  C.最小最大损失准则

  D.最小误判概率准则


  正确答案:BC

  @刘炫320,本题题目及解析来源://blog.csdn.net/column/details/16442.html
  选项 A ,最小损失准则中需要用到先验概率

  选项B ,在贝叶斯决策中,对于先验概率p(y),分为已知和未知两种情况。 
  1. p(y)已知,直接使用贝叶斯公式求后验概率即可; 
  2. p(y)未知,可以使用聂曼-皮尔逊决策(N-P决策)来计算决策面。 
  聂曼-皮尔逊决策(N-P判决)可以归结为找阈值a,即: 
  如果
p(x|w1)/p(x|w2)>a,则 x属于w1; 
  如果
p(x|w1)/p(x|w2)<a,则 x属于w 2;

  选项C ,最大最小损失规则主要就是使用解决最小损失规则时先验概率未知或难以计算的问题的。




转载自:https://mp.weixin.qq.com/s?__biz=MzI4MTQ2NjU5NA==&mid=2247485862&idx=2&sn=cbc80afcfd09ec8ec3e2e75de16aeb64&chksm=eba98a2bdcde033d28a812ab26da4c60356331aefd1f2e9a00cc2fa0533a7df6e6f7357329c9&scene=21#wechat_redirect

招聘 不方便扫码就复制添加关注:程序员招聘谷,微信号:jobs1024



深度学习面试题2018
1、问题:如何优化模型:加速收敛,避免overfit,提升精度..?答案:可以从以下几个参数开始:-batchsizeeffect;-learningrateeffect;-weightinitializationeffect;-batchnormalization-drop-out;-modelaverage;-fine-tunin
深度学习面试100题(第1-5题):经典??嫉鉉NN
1、梯度下降算法的正确步骤是什么?a.计算预测值和真实值之间的误差b.重复迭代,直至得到网络权重的最佳值c.把输入传入网络,得到输出值d.用随机值初始化权重和偏差e.对每...