当前位置: 首页 > news >正文

网站线下推广怎么做seo刷词

网站线下推广怎么做,seo刷词,网站家建设培训学校,装修报价单明细表开篇高能预警#xff01;本文前置知识#xff1a;1、理解特征函数/能量函数、配分函数的概念及其无向图表示#xff0c;见《逻辑回归到受限玻尔兹曼机》和《解开玻尔兹曼机的封印》#xff1b;2、理解特征函数形式的逻辑回归模型#xff0c;见《逻辑回归到最大熵模型》。从… 开篇高能预警本文前置知识1、理解特征函数/能量函数、配分函数的概念及其无向图表示见《逻辑回归到受限玻尔兹曼机》和《解开玻尔兹曼机的封印》2、理解特征函数形式的逻辑回归模型见《逻辑回归到最大熵模型》。 从逻辑回归出发我们已经经过了朴素贝叶斯、浅层神经网络、最大熵等分类模型。显然分类模型是不考虑时间的仅仅计算当前的一堆特征对应的类别。因此分类模型是“点状”的模型。 想一下如果我们有一个词性标注POS的任务在这个任务中类别有动词、名词、形容词、副词、介词、连词等有限个类别。样本呢当然就是自然语言序列啦例如“夕小瑶喜欢 狗狗”这个序列就对应着“名词 动词 名词”这三个对应类别。 这时我们如果用“点状”模型也就是分类模型来做这个任务会产生什么现象呢假如我们选取的特征就是当前位置词那么我们将分类器训练完成后分类器遇到“夕小瑶”就会输出“名词”这个类别也就是说它是不考虑上下文的预测每个词的词性的时候才不会考虑整个句子的情况呢。在这里简单例子中看似没有什么影响然而实际上非常多的词在不同的句子中会表现出不同的词性。比如“谷歌”一词在“我今天参观了谷歌”中就是名词在“你谷歌一下”中就是动词。可以看出词性不仅取决于它自己还取决于它的上下文它两边的词 那么有没有可能让逻辑回归、朴素贝叶斯这类点状模型利用好上下文信息呢最容易想到的做法就是将上下文信息编码成特征啦 比如加入当前词的2-gram上下文作为特征这时在“你谷歌一下”中去预测“谷歌”的词性的时候特征就是三维的1、“谷歌”2、“你 谷歌”3、“谷歌 一下”。而在“我今天参观了谷歌”中特征是1、“谷歌”2、“了 谷歌”3、“谷歌 EOS”这样就能根据不同的特征值在不同的句子中更精确的分类“谷歌”的词性啦在《逻辑回归到最大熵模型》中小夕详细讲了如何将逻辑回归的传统形式转换成特征函数/能量函数描述的形式而如《解开玻尔兹曼机的封印》所示这种形式很容易画成有向图或无向图的形式 上面白色圈圈是类别下面灰色圈圈是各个特征小黑框表示这一类别-特征对的能量函数/特征函数 问题来了。对于一些更复杂的句子可能决定某个词的词性的关键词距离该词有好长的距离那怎么办呢难道要扩展到10gram我们知道ngram越长训练数据就越稀疏导致模型容易过拟合泛化能力明显变差。显然点状的机器学习模型是很难在当前分类点利用到长距离信息的也就是说其最多能通过加入短距离上下文特征来做到局部最优分类而无法做到整个序列的最优分类。 显然呐自然语言文本的词性标注任务本来就是个“线状”的任务你非要用“点状”的模型去做肯定很差劲啦那么我们能不能基于逻辑回归这个经典的判别式点状分类器来改良成“线状”或者说“链状”模型呢如果让你去改造你会怎么改呢 最简单的做法当然就是将序列前一时刻/位置的输出连到当前时刻到输出阿也就是同时用当前时刻的输入和前一时刻的输出来决定当前时刻的输出(类别)画出图来就是 当然啦这里白色圈圈依然代表类别灰色圈圈代表特征。为了画图简单这里只画出了一个灰色圈圈三个特征的时候应该在每个时刻画出三个灰色圈圈哦 看是不是超级简单的就改完了呢这样在判断每一时刻的类别的时候就会不得不去参考前一时刻的类别而参考前一时刻的类别的时候就隐含的包含了更早时刻的类别这样就把整个句子串起来啦。画起来容易但是这个模型该如何用数学语言描述呢 回顾一下可以直接画出上面逻辑回归的无向图的逻辑回归假设函数扩展到多个类别的话就是  从假设函数也可以看出逻辑回归是个点状模型当前时刻的类别预测不依赖任何其他时刻。 那么根据上面我们画的判别式链状模型图我们唯一需要做的就是加入前一时刻y与当前时刻y的特征函数就可以啦所以假设函数就很简单的变为了  只是看起来有点长而已而本质上还不是用特征函数描述了我们画的线状图嘛仔细观察可以发现相比较点状模型链状模型考虑了全部时间点对全部时间点下的每个旧y与当前y以及每个当前x与当前y做了求和进而通过配分函数Z算出了整个序列的条件概率注意对比逻辑回归的假设函数逻辑回归的各个时间点是相互独立的而这个链状模型则是统一考虑所有时间点因此是基于整个序列去做每个单词的词性预测。 这个看似复杂实则至简的链状模型就是“线性链条件随机场CRF”。实际上线性链的条件随机场也是使用最广泛的条件随机场几乎成了条件随机场的代名词。 这个模型的训练方法与隐马尔可夫模型是一样的都是基于最大化似然函数的方法方法已经在《HMM下》中讲解啦在此不再赘述。当然啦小夕只讲了最理想的情况也就是训练集中既有X观测序列也有Y隐状态序列的情况。对于无法得到隐状态序列的情况可以使用《EM算法》来迭代训练在这里叫做BaumWelch算法有兴趣的同学自行了解这里不再展开啦。 诶还有一个问题虽然CRF的假设函数可以直接得到当前序列的每种可能的词性标注序列的概率但是如果要枚举出所有可能的词性序列再找最大概率的那个词性序列的话显然是指数爆炸的。对此有维特比算法进行优化也已在《HMM下》中详细讲解过啦。在此不再赘述。值得一提维特比算法的本质即动态规划。 看是不是感觉一切都是一通百通了呢这么看来条件随机场真的是没有新奇的东西仅仅是用特征函数的老办法来将人人都能想到的前后两个时刻的y连起来就结束了结束了束了了。。
http://www.yutouwan.com/news/17752/

相关文章:

  • 北京网站建设新闻php wordpress
  • 淘宝客网站怎么做优化杭州设计公司有哪些
  • 温州网站制作要多少钱wordpress登录搜索
  • 超人气网站是这样建成的全球采购商平台
  • 做网站用什么写编写wordpress主题
  • 规划馆网站建设wordpress实现分页
  • 怎么在公司网站上安装百度商桥贵州建筑网站
  • 桂平逗乐游戏招聘网站开发wordpress的滑块换成图片
  • 公司管理培训课程seo关键词推广价格
  • 高企达建设公司网站智能建站做网站好吗
  • 国内简约网站小程序官网入口
  • 网站模板源代码下载wordpress oa插件
  • 十堰市建设工程管理处网站域名备案有什么用
  • 一个人可以做几个网站免费wordpress主题 h5
  • 东营网站设计wordpress少儿主题
  • 电子商务网站建设域名施工企业安全生产评价表下载
  • 建设信用卡商城网站php网站开发框架搭建
  • 常用来做网站的首页商贸有限公司起名字
  • 外贸建站系统源码微信企业网站html5模板
  • 网站的加盟代理邯郸网站制作基本流程
  • 网站分站是怎么做的中国app开发公司排名
  • 网站建设最重要的环节淘宝优惠券怎么做网站
  • 好看的知名企业网站为何公司做的网站很丑
  • 全国通网站建设WordPress在服务器什么位置
  • 陕西省建设厅网站怎么查焊工证wordpress邮件发送下载
  • 中国建设银行网站首页签约做关于灯饰的网站
  • 快速达建网站视频直播app开发
  • 自己做返利网站吗山西建设网站公司
  • 网站建设业务渠道WordPress调用发邮件
  • 中国建设银行信用卡网站首页江苏做网站