当前位置: 首页 > news >正文

网站界面设计方案wordpress 发布文章 自定义栏目

网站界面设计方案,wordpress 发布文章 自定义栏目,互联网信息服务平台入口,服务器安装wordpress来源#xff1a;机器之心摘要#xff1a;原华为诺亚方舟实验室主任、现已加入字节跳动 AI Lab的李航教授近日发表博客#xff0c;对自然语言对话领域的现状和最新进展进行总结#xff0c;并展望了未来的走向。1. 引言语音助手、智能客服、智能音箱、聊天机器人#xff0c;… 来源机器之心摘要原华为诺亚方舟实验室主任、现已加入字节跳动 AI Lab的李航教授近日发表博客对自然语言对话领域的现状和最新进展进行总结并展望了未来的走向。1. 引言语音助手、智能客服、智能音箱、聊天机器人近年各种自然语言对话系统如雨后春笋般地涌现有让人眼花缭乱的感觉。一方面对话系统越来越实用化另一方面当前技术的局限性也凸显无遗。计算机多大程度上可以自如地和人进行对话自然语言对话的挑战在什么地方未来可能会有哪些突破以及需要重点研究与开发哪些技术笔者曾有幸在华为与前同事一起进行了对话技术的研究以及华为 Mate10 语音助手的开发本文基于自己的研究与开发经验尝试对以上问题做出回答。2. 前提条件功能主义脑科学和人工智能的先驱马尔David Marr曾提出计算有三个层面自上而下分别是功能层面、算法和表征层面、实现和物理层面。如果有两个系统做计算给定同样输入产生同样输出两个系统的行为完全一致则认为它们在功能层面是等价的。这时不考虑它们在算法层面进行的是串行计算还是并行计算也不考虑它们在实现层面进行的是数字计算还是模拟计算。两个系统一个是人脑一个是计算机情况也一样。假设人的思维可以还原为计算那么只要看到功能上计算机可以和人脑做同样的事情就认为它们在功能上拥有同等的智能。本文讨论对话系统也是站在功能主义的立场。合理行动的智能机器人工智能是关于构建智能机器或智能计算机的科学与工程领域但对智能机器有不同的定义。可以是像人一样行动的智能机器也可以是合理行动的智能机器。本文采用后者的定义。合理行动的智能机器有以下几个特点。1. 系统与环境互动2. 目标导向有明确的任务要完成3. 有评价完成任务好坏的标准4. 旨在功能上完成任务并不试图模仿人类5. 完成任务上能力达到或超过人类。构建合理行动的智能机器比起构建像人一样行动的智能机器在人脑的工作机理还不是很清楚的现在更加现实可行。现在的大部分人工智能系统都属于这种类型。大数据与机器学习使人工智能的这条路线更加容易取得突破。笔者近期的短文《合理行动的智能机器》对相关问题做了更详细的论述 [1]。图灵测试的对象实质上是像人一样行动的智能机器但如何评价像人一样行动并不容易。如果目的是为人类提供智能性的工具提高人们的生活质量或工作效率可能没有必要考虑构建像人一样行动的机器。图灵测试作为人工智能的测试实验有其局限性。所以近未来构建「合理行动的」对话系统应该是我们追求的目标。为用户提供问答、帮助用户完成任务打开音箱、订机票、甚至做用户的陪伴都满足以上合理行动的智能机器的特点。3. 自然语言对话自然语言理解自然语言理解也就是人或机器理解人类语言有两种不同定义一种基于表征另一种基于行为。基于表征representation就是系统根据输入的语言产生相应的内部表征这个过程也称为语义接地semantic grounding。比如有人说「哈利波特」在大脑里联系到哈利波特的概念就意味着理解了对方的语言。基于行为就是系统根据输入的语言采取相应的动作。比如有人说「给我拿一杯茶」机器人按照命令做了就认为它理解了人的语言。这两个定义在一定程度上互为补充前者从语义角度后者从语用角度界定这个问题。下面从功能角度概述语言理解过程可以是人脑也可以是计算机系统。自然语言理解输入是自然语言的语句输出是语句的语义表征包括词汇分析、句法分析、语义分析、语用分析几个步骤如图 1 所示。原则上是自下而上的处理也有自上而下的指导一般是两者的结合。词汇分析使用词典句法分析使用句法语义分析使用世界知识语用分析使用上下文信息。 图 1. 自然语言理解过程词汇分析将输入语句中的单词映射到单词的语义表征上。每一个单词都有丰富的语义。一个单词的语义包含了它的相关概念以及使用方法。一个语言的常用词汇量一般在 5 万到 10 万的范围。句法分析根据句法规则判断输入语句中的单词之间的语法关系得到语句的语法表征。句法既有一定的规律也有大量的例外。一个语言的语法是一个非常复杂的规则体系。语义分析基于单词的语义表征、语句的语法表征根据系统中的世界知识的表征构建语句的可能是多个语义表征。语用分析基于语句的语义表征根据系统中的上下文确定语句具体语义表征。自然语言理解的核心是听到一句话或者读到一句话把它映射到系统的一个表征上面。这个映射是一个多对多的映射必然产生多义性ambiguity和多样性variability也就是一句话可以有多个意思一个意思有多种方法表达。比如「I saw a girl with a telescope」一句话表示两个不同的意思这是多义性。再比如「distance between sun and earth」和「how far is sun from earth」两句话表示的是同一个意思这是多样性。语义分析进行的只是在字面上对语言的理解可能还有多个意思对应着多个语义表征。语用分析进行的是在上下文中的语言理解。同样一句话比如「这个房间真热」语义上就是字面的意思但是语用上话者的真实意图可能是「请把窗户打开」只有在上下文中才能判断。必须指出语言是一个极其复杂的现象 [2]虽然从功能上有可能在计算机上实现或者近似语言理解。仍然有许多挑战还有漫长的路途要走。人脑的语言理解机制对人脑的语言处理机制了解的还不多有一些发现和假说。人的自然语言理解整个大脑都在参与是一个非常复杂的过程。大脑大约有 1 千亿 个神经元1 千万亿个连接是一个庞大的复杂网络人的思维是在这个网络上进行的并行处理。通过核磁共振发现人在聆听他人朗读的时候大脑的各个部位都有反应 [3]。有两个脑区和语言密切相关布洛卡区Brocas area和韦尼克区Wernickes area是在对失语症的研究过程中发现的 [4]。韦尼克区负责词汇布洛卡区负责句法。患有失语症的病人的特点是如果布洛卡区受损说话只会说出一个个单词没有语法不能形成语句。如果韦尼克区受损说话听起来是一个语句但可能用词不对不能形成完整的语义。有一个假说是人脑中的词汇分析和句法分析是并行处理布洛卡区和韦尼克区的功能分工是一个证据。最近的嵌入模拟假说embodied simulation hypothesis颇受瞩目有大量的脑科学与认知科学的实验佐证 [5]。人脑中语言的理解是基于视觉、听觉、运动等的表象image的模拟。语言理解过程就是把相关表象联系起来并将这些表象重新组合的过程。比如问「大猩猩有没有鼻子」要回答这个问题我们会在脑里先浮现出大猩猩的视觉表象然后根据这个表象去回答问题。说明大猩猩的概念在我们的脑子里至少有一部分是通过视觉表象记忆和理解的。再比如听到「Flying Pig飞猪」不同的人会根据自己对飞的概念的理解飞的表象以及对猪的概念的理解猪的表象组合成不同的新的表象也就是语言理解。有人会想象出像小飞象一样的 Flying Pig也有人会想象出像阿童木一样的 Flying Pig。语言对话与任务罗素曾举过这样一个有趣的例子说明语言的本质是表达和交流的工具。当牙医碰到你时你可能会不由自主地发出呻吟这不算语言。但是如果他说「如果我碰到你你告诉我一声」这时你发出同样的呻吟它就成了语言。对话是两个或更多人之间的书面或口头的交流从功能主义的角度来看对话的目的是话者共同完成信息交流的任务。多轮对话包含单轮对话在对话的每一轮中一方需要理解另一方的语言。比如问候、问答协作如订机票甚至说服、辩论等都可以看作是任务。其实聊天也可以看作是任务目的是进行交流和沟通整个过程可以分解为不同的子任务每个子任务都有明确的目标。聊天的特点是开始不特意设定子任务在过程中子任务动态地变化随时被设定、终结、恢复。对话中要完成的任务一般可以由一个有限状态机表示其中状态表示完成任务的一个阶段有一个目标状态若干个初始状态从一个初始状态到达目标状态往往有多个路径甚至许多路径。完成对话对应着从初始状态出发通过一条路径到达目标状态。比如说订机票需要通过与对方交流提供相关信息每一个状态表示目前为止明确的信息。当任务简单的时候有限状态机的状态数不多模型的复杂度不高。但是当任务变得复杂时状态数和模型的复杂度会爆炸式地增加。现实中对话任务的形式化还有不少挑战特别是当任务复杂状态无法穷举、或者状态无法明确刻画的时候。所以对话系统还都局限在特定任务上称为任务驱动的对话比如命令型、问答型。对话过程中需要对对方的发话进行理解也就是产生内部的表征。否则无法判断任务的完成情况也就是状态进行任务驱动的对话。任务驱动的对话需要有语义表征。4. 当前技术计算机上达到和人同等的对话能力还非常困难。现在的技术一般是数据驱动基于机器学习的。对话技术分单轮对话和多轮对话。单轮对话有基于分析的基于检索的基于生成的方法。表 1 给出几种方法的比较。基于分析的方法把问题定义为分类和结构预测。给定自然语言的发话将发话转为内部的表征之后产生系统的回复或动作。这种方法有显式的内部语义表征适合于命令型的对话在语音助手和智能音箱等应用上被广泛使用。基于检索的方法把问题定义为匹配。给定自然语言的发话将发话与内部的文本进行匹配之后将匹配到的文本返回作为回答。这种方法以文本非结构化数据形式拥有内部语义表征可以做问答型的对话在问答系统等应用被广泛使用。基于生成的方法把问题定义为文本的转换或翻译。给定自然语言的发话一般利用深度学习模型自动生成相应的回复。这种方法不拥有显式的语义表征适合于自动生成回答的场景比如邮件的智能回复。多轮对话系统使用范围相对有限当前多用于特定领域的任务型对话。如图 2 所示一般地多轮对话系统拥有语言理解语言生成对话管理知识库等模块。对话管理又包括状态跟踪和动作选择子模块。可以认为多轮对话系统是基于分析的单轮对话的扩展在每轮对话中对发话进行语义理解产生内部表征。对话管理使用有限状态机表示对话中获取信息的整个过程。经过几轮对话系统逐步获取所需信息并执行任务如航班信息查询。表 1 单轮对话方法比较 图 2 多轮对话系统5. 最新进展近年深度学习、强化学习被成功应用到包括对话在内的自然语言处理的各个方面并且取得了重大进展。端到端的训练和表征学习是深度学习的主要特点正是这些特点使深度学习成为自然语言处理的强大工具对话也不例外。强化学习适合于系统与环境互动并在这个过程中学习的贯序决策过程sequential decision process问题多轮对话正是其应用。下面介绍几个最新研究成果。Liang 等开发了神经符号机Neural Symbolic Machines模型 [7]。神经符号机可以从知识图谱三元组中找到答案回答像「美国最大的城市是哪里」这样的问题。模型是序列对序列sequence-to-sequence模型将问题的单词序列转换成命令的序列。命令的序列是 LISP 语言的程序执行程序就可以找到答案。神经符号机的最大特点是序列对序列模型表示和使用程序执行的变量用附加的键--变量记忆key-variable memory记录变量的值其中键是神经表征、变量是符号表征。模型的训练是基于强化学习策略梯度法的端到端的学习。吕等开发了神经查询器Neural Enquirer、符号查询器Symbolic Enquirer连接查询器Coupled Enquirer三个模型 [8,9]用于自然语言的关系数据库查询。比如可以从奥林匹克运动会的数据库中找答案回答「观众人数最多的奥运会的举办城市的面积有多大」这样的问题。问答系统包括语言处理模块、短期记忆、长期记忆、查询器语言处理模块又包括编码器和解码器。查询器基于短期记忆的问题表征神经表征从长期记忆的数据库中符号表征与神经表征寻找答案。符号查询器是一个循环神经网络将问句的表征神经表征转换为查询操作符号表征的序列执行操作序列就可以找到答案。利用强化学习具体地策略梯度法可以端到端地学习这个循环神经网络。神经查询器是一组深度神经网络将问句的表征神经表征多次映射到数据库的一个元素符号表征也就是答案其中一个神经网络表征一次映射的模式。利用深度学习具体地梯度下降法可以端到端地学习这些深度神经网络。符号查询器执行效率高学习效率不高神经查询器学习效率高执行效率不高。连接查询器把两者的优点结合起来。学习时先训练神经查询器然后以其结果训练符号查询器问答时只使用符号查询器。Peng 等提出了基于层次化深度强化学习hierarchical reinforcement learning的对话策略学习方法可以通过多轮对话帮助用户做旅行安排包括预订机票、订酒店 [10]。对话系统整体架构与图 2 的相似有语言理解、对话管理、语言生成模块。对话管理模块有两层结构顶层模块负责管理子任务底层模块负责管理子任务中的动作状态跟踪模块负责管理全局的跨子任务的约束条件如酒店的入住时间需晚于航班的达到时间。对话管理策略通过层次化深度强化学习获得。6. 未来展望下面列举自然语言对话中比较重要的研究课题。• 对话需要语义接地即将自然语言映射到内部的表征如何定义和使用语义表征是一个核心问题。• 语言理解的多义性、多样性问题。虽然迄今有很多研究但仍然没有根本解决。• 语言和知识既可以由符号表征又可以由向量表征神经表征各有优缺点如何将符号处理和深度学习结合是一个重要的问题。• 多轮对话系统可以基于深度强化学习也有很多问题需要研究。• 对话系统是一个复杂的系统需要进行层次化和模块化处理如何构建这样的系统并使其拥有自动学习功能也是一个大问题。• 机器学习的数据往往是不够的这使得端对端训练一个对话系统变得困难在小样本的条件下学好对话模型是需要解决的重要课题。7. 总结以下将本文的主要观点进行总结。从功能的角度计算机也有可能能够像人一样自如地进行自然语言对话但是现在这个命题无法证真或证伪。原因是尚不清楚人脑的语言理解机制用计算机完整模拟人的语言理解仍然非常困难。但在特定领域特定场景下和人一样进行自然语言对话的计算机的实现我们已经看到。问题是如何进行扩展能够以更低的开发成本覆盖更多的领域和场景。语言理解的核心是向内部表征的映射。多义性和多样性是计算机进行语言理解最大的挑战。要完成具体的任务体现计算机的智能性定义和使用内部表征看来是不可或缺的。基于分析的方法本质上是重要的甚至是在聊天机器人的场景。基于检索方法更适合于单轮问答的场景。基于生成的方法只能用于特定的场景。多轮对话要体现完成任务的整个逻辑有限状态机表示。开放式的对话意味着动态地改变任务所以在现在的技术条件下是非常困难的在特定领域任务明确的条件下的对话现实可行。近年深度学习和强化学习的使用使得对话有了长足的进步。主要体现在表征学习、端到端学习上。事实上需要符号表征和神经表征深度学习和符号处理的结合这应该是未来发展的重要方向。参考文献[1] 李航合理行动的智能机器计算机学会通讯第 14 卷第 7 期2018 年[2] 李航迎接自然语言处理新时代计算机学会通讯第 13 卷第 2 期2017 年[3] 蒲慕明脑科学给人工智能带了来什么2016.[4] Steven Pinker. The Language Instinct, 1994.[5] Benjamin Bergen, Louder Than Words: The New Science of How the Mind Makes Meaning, Basic Books, 2012.[6] 李航、吕正东、尚立峰基于大数据与深度学习的自然语言对话CSDN2015 年[7] Liang C, Berant J, Le Q, et al. Neural Symbolic Machines: Learning Semantic Parsers on Freebase with Weak Supervision. ACL 2017.[8] Pengcheng Yin, Zhengdong Lu, Hang Li, Ben Kao. Neural Enquirer: Learning to Query Tables with Natural Language. IJCAI 2016.[9] Lili Mou, Zhengdong Lu, Hang Li, Zhi Jin, Coupling Distributed and Symbolic Execution for Natural Language Queries, ICML 2017.[10] Baolin Peng, Xiujun Li, Lihong Li, Jianfeng Gao, Asli Celikyilmaz, Sungjin Lee, Kam-Fai Wong, Composite Task-Completion Dialogue Policy Learning via Hierarchical Deep Reinforcement Learning, EMNLP 2017.未来智能实验室是人工智能学家与科学院相关机构联合成立的人工智能互联网和脑科学交叉研究机构。未来智能实验室的主要工作包括建立AI智能系统智商评测体系开展世界人工智能智商评测开展互联网城市云脑研究计划构建互联网城市云脑技术和企业图谱为提升企业行业与城市的智能水平服务。  如果您对实验室的研究感兴趣欢迎加入未来智能实验室线上平台。扫描以下二维码或点击本文左下角“阅读原文”
http://www.huolong8.cn/news/317605/

相关文章:

  • 网站后台不能上传图片wordpress 增加内存
  • 网站建设和维护人员职责建个网站需要投资多少
  • 定制网页设计报价seo推广的常见目的有
  • 郑州站网址导航主页
  • 网站基本信息设置规划网站总结
  • 做湲网站网站访客qq获取代码
  • 廊坊高端网站建设天津网站制作重点
  • 网站素材模板 站长国外建筑公司网站
  • 免费做产品画册的网站一站式做网站
  • 自己做的网站怎么让别人看到设计师接私活的兼职平台
  • 大腕 网站建设天津网络关键词优化
  • 贵阳网站建设公司哪家好wordpress更改站点地址
  • 利用百度快照搜索消失的网站初级网页设计师
  • 金融投资网站模板广州网站制作开发公司
  • 温州网站建设这个免费响应式企业网站源码
  • 建设网站模式成都网站建设联系电话
  • 网站建设相关工作总结短链接制作
  • 网站开发工作流程全景效果图如何制作
  • 黄石下陆区建设局网站广东省建设监理协会网站官网
  • 截获网站流量怎么做怎样做网站视频
  • 做网站需要注意哪些东西西班牙语网站建设
  • 维修网站建设菏泽网站建设费用
  • 那些钓鱼网站是怎么做的想做网站制作运营注册什么公司核实
  • 龙华网站(建设信科网络)万网的网站建设
  • 网站头部修改机关网站建设创新
  • 做标签网站邀请码泰州市建设监理协会网站
  • 城阳区建设银行网站重庆维力安网站建设
  • 做网站前景怎么样宁波h5模板建站
  • 找工作哪个网站好2022网站群建设公司排行榜6
  • 网站排名优化系统全球访问量最大的网站