重庆网站排名推广,辽宁建设工程信息网ca锁激活,网站建设方案平台,免费网页注册一、多示例 多示例学习属于弱监督学习中的一种#xff0c;在对模型进行训练时#xff0c;我们需要把训练数据分成正负包#xff0c;再将每个包分成大小相同的示例#xff0c;并且我们只对包的正负进行标注#xff0c;而不对示例进行分类。当某个包被标识为正时#xff0c…一、多示例 多示例学习属于弱监督学习中的一种在对模型进行训练时我们需要把训练数据分成正负包再将每个包分成大小相同的示例并且我们只对包的正负进行标注而不对示例进行分类。当某个包被标识为正时该包里必须包含一个示例为正而其他示例既可能是负也可能是正。而当一个包被标记为负时它里面的所有示例一定全部为负如图2-1所示。与监督学习相比多示例学习中的每个示例都是没有标注的而与无监督学习相比多示例学习的训练数据包是有标注的。在以往的各类学习框架中样本与示例通常是一一对应的关系而在多示例学习中我们将一个样本作为一个包一个包中具有多个示例样本和示例是一对多的关系这就使得用以往的训练模式并没有很好解决的问题现在通过多示例学习就能够更加容易的解决了。 弱监督学习根据数据集标签情况大致可分为不完全监督、不确切监督和不准确监督学习三种不完全监督学习中只有部分训练数据带有标签不确切监督学习中训练数据只给出粗粒度的标签不准确监督学习中训练数据的标签并不都是正确的。多示例学习属于不确切监督学习的一种其只有粗粒度的标签信息可用。在多示例学习中训练集由带标签的多示例学习包组成多示例学习包由不带标签的示例构成多示例学习算法的目的是预测测试集中多示例学习包的标签并找出决定多示例学习包标签的关键性示例。
二、多标记学习 举例来说在功能基因组学问题中每个基因可能同时具有多种功能如“新 陈代谢”“转录”以及“蛋白质合成”在场景分类问题中每幅场景图像可能 同时包含了多种语义信息如“海滩”与“城市”在视频自动标注问题中每 个视频片断可能同时对应于多个语义类别如“城市”与“建筑”等等。对于上 述这些多标记学习问题训练集中的每个示例均对应于一组概念标记学习系统 通过对多标记示例构成的训练集进行学习以尽可能正确地预测训练集之外的示 例的概念集合。 如果限定每个样本只对应于一个概念标记那么传统的二类以及多类学习问 题均可看作多标记学习问题的特例。然而另一方面多标记学习问题的一般性使 得解决该问题的难度大大增加。一种直观地解决多标记学习问题的方法是将其分 解为多个独立的二类分类问题来求解其中每个二类分类问题对应于一个可能的 概念类。然而由于该类方法没有考虑到每个样本所对应的概念标记之间的相关性因此其泛化性能往往并不理想。例如在文档类问题中如果已知一篇文 档隶属于体育新闻类则该文档同时隶属于休闲新闻类的可能性将大于其隶属于 政治新闻类的可能性。再比如如果已知一段视频或一幅图像隶属于“野生动物” 类则该视频或图像同时隶属于“草原”类的可能性将大于其隶属于“城市”类 的可能性。因此多标记学习问题的主要难点就在于如何充分利用各训练样本所 含多个概念标记之间的相关性从而有效地预测未知样本的概念标记集合。 三、多示例多标签学习
例如在图像分类问题中一幅图像通常包含多个区域其中每个区域可以由 一个示例进行表示与此同时该图像可能同时隶属于“山”与“树”等多个概念 标记在文本分类问题中每个文档通常包含多个段落其中每个段落可以由一个 示例进行表示而该文档在从不同的角度进行考察时可能同时隶属于“科幻小 说”、“儒勒·凡尔纳作品”甚至“旅游书籍”类 该学习框架下每个对象由多个示例表示且同时隶属于多个概念标记。