广州去东莞回来要隔离吗,seo的含义是什么意思,邯郸市都有哪些网络推广公司,wordpress需要收费吗概述
FM (Factorization Machine) 算法可进行回归和二分类预测#xff0c;它的特点是考虑了特征之间的相互作用#xff0c;是一种非线性模型#xff0c;目前FM算法是推荐领域被验证的效果较好的推荐方案之一#xff0c;在诸多电商、广告、直播厂商的推荐领域有广泛应用。 …概述
FM (Factorization Machine) 算法可进行回归和二分类预测它的特点是考虑了特征之间的相互作用是一种非线性模型目前FM算法是推荐领域被验证的效果较好的推荐方案之一在诸多电商、广告、直播厂商的推荐领域有广泛应用。
PAI平台的FM算法基于阿里内部大数据的锤炼具备性能优越、效果突出的特点。具体使用方式可以参见首页模板 使用FM算法整体流程需要包含FM训练和FM预测组件可以搭配评估组件使用。 输入数据要求
目前PAI的FM算法只支持libsvm格式的数据数据需要包含两列分别是特征列和目标列。
目标列Double类型特征列String类型特征要以k:v格式输入特征直接以逗号分隔
如图 组件说明
1.FM训练
在“参数设置”中可以设置回归或者分类两种模式 PAI命令
参数解释取值tensorColName训练的特征列名 (kv格式的字符串例如1:1.0,3:1.0特征的id必须是非负整数取值范围是[0,Long.MAX_VALUE)可以不连续必选labelColNamelabel列名 (要求是数值类型如果任务类型是binary_classification那么label值必须是0或1)必选task任务类型必选regression or binary_classificationnumEpochs迭代数可选默认值10dim因子数字符串用逗号分隔的三个整数表示0次项、线性项、二次项的长度可选默认值 1,1,10learnRate学习率可选 默认值 0.01lambda正则化系数字符串用逗号分隔的三个浮点数表示0次项、线性项、二次项的正则化系数可选 默认值 0.01,0.01,0.01initStdev参数初始化标准差可选 默认值0.05
备注1
如遇到训练发散可适当降低学习率的值
2.FM预测
PAI命令
参数解释取值predResultColName预测结果列名可选默认prediction_resultpredScoreColName预测得分列名可选默认prediction_scorepredDetailColName详细预测信息列名可选默认prediction_detailkeepColNames保持到输出结果表的列可选默认全选
评估结果
在首页模板案例的数据情况下使用PAI FM生成的模型可以达到接近0.97的AUC 原文链接 本文为云栖社区原创内容未经允许不得转载。