鄞州区优秀营销型网站建设首选,企业商务网站建设论文,哈尔滨市呼兰区住房城乡建设局网站,小程序官网入口最近由于研究需要#xff0c;需要在机器学习项目的结果中加入假设检验的内容#xff0c;但是机器学习中的假设检验和数理统计中的假设检验不同#xff0c;是数理统计中假设检验的延申。但是#xff0c;本来假设检验就是数理统计中的比较绕的一部分#xff0c;比较难懂需要在机器学习项目的结果中加入假设检验的内容但是机器学习中的假设检验和数理统计中的假设检验不同是数理统计中假设检验的延申。但是本来假设检验就是数理统计中的比较绕的一部分比较难懂优秀的博客比较少结合机器学习的就更少了最近学习之后来进行一个总结。 机器学习中的假设检验是统计学中的假设检验的扩充大家可以先了解一下本人另一篇博客统计学下的假设检验。
1为什么需要在机器学习项目中需要假设检验 当我们采用某种实验评估方法(留出法交叉验证法)测得了某个学习器在测试集上的某个性能度量结果。那么怎么比较这个学习器的效果就是很好的呢直接看他们在测试集上面的性能度量(RMSE,F1值)的结果吗 其实不然机器学习中的性能度量的比大家想象的要复杂一些。主要涉及以下几个因素
我们希望比较的是泛化性能但是在测试集上面的性能未必和泛化性能相同测试集上的性能和测试集本身有关不同的测试集其结果会相差巨大很多机器学习算法本身会存在一定的随机性即使使用相同参数相同测试样例得到的结果也不一定相同 因此就提出使用假设检验进行性能的度量一个抽象的统计下的理论推断 若在测试集上观察到学习器A比学习器B好则A的泛化性能是否在统计意义上优于B以及这个结论把握有多大。这就是机器学习下的假设检验的基础。