宝塔建站详细教程,网页源代码怎么打开,网站设计哪家公司好,wordpress 中文标签插件下载来源#xff1a;人工智能计算大会作为第四次工业革命的核心#xff0c;人工智能已经成为全球新一轮科技革命和产业变革的核心驱动力。在2021人工智能计算大会#xff08;AICC 2021#xff09;上#xff0c;清华大学智能科学讲席教授、美国艺术与科学院院士张亚勤带来了《智… 来源人工智能计算大会作为第四次工业革命的核心人工智能已经成为全球新一轮科技革命和产业变革的核心驱动力。在2021人工智能计算大会AICC 2021上清华大学智能科学讲席教授、美国艺术与科学院院士张亚勤带来了《智能计算新趋势》主题演讲分享了在信息、物理和生物智能融合的新时代下AI计算面临的新挑战及突破传统范式的新趋势。同时张亚勤教授分享了人工智能在生命科学、绿色计算及自动驾驶领域最前沿的应用成果探讨人工智能的技术如何真正赋能各产业推动社会的进步。以下是张亚勤教授演讲原文有删减大家好特别高兴参加人工智能计算大会我今天分享的是有关于产业发展的新趋势包括人工智能在生命科学、双碳趋势下的绿色计算、自动驾驶等领域中扮演的一些角色。AI计算趋势在过去30年中如果说有一件事是最重要的那无疑是“数字化”在80年代、90年代我们所做的是把内容和企业数字化。从当时的语音、图像、视频、文本后来到企业ERP、CRM包括云计算其实是数字化的1.0和2.0阶段。现在我们进入了新一轮的数字化3.0这包括两个世界的数字化。■ 一是物理世界数字化我们的路、车、交通灯家庭、车间车床工厂甚至整个城市都在数字化。■ 二是生物世界即我们的生命世界也在数字化我们的大脑、身体器官、DNA基因、蛋白质等正在走向数字化同时各种新的生物电子芯片、脑机接口技术也在不断发展。麻省理工学院多媒体实验室主任Nicholas Negroponte写的《数字化生存》谈的就是数字化1.0他认为这是从原子到信息再到比特的变革过程。至于数字3.0阶段我认为是从比特回到原子、分子的过程可以说是原子、分子和比特的双方映射。第三次数字化和第一轮、第二轮有完全不同的一些特点。一方面是指数级的数据比如在无人车领域每天一辆车产生的数据量是5T在基因测序领域每一次测序产生的数据是3T蛋白质三维结构的数据10300所以数据在海量地增长。另一方面这些数据主要不是给人而是给机器做决策的是机器到机器的环节。人工智能经过了很多发展阶段最早是更多依靠知识的符号逻辑推理但知识并不完备所以造成了AI的第一个冬天。而现在更多是数据驱动的深度学习未来我认为是知识和数据的融合包括关于大脑的知识以及大量的现实世界数据同时也包括第一性原理方程式比如薛定谔方程、分子动力学方程等等深度学习可以说是这十年来的主流从RNN、LSTM、CNN到现在的GAN和Transformer其经历了丰富的发展阶段当下的方向是预训练、多模态、大模型。其中有不少挑战包括因果性、可解释性、透明性但也有新的解决方案。目前在感知方面机器已经达到和人类相当的水平甚至在某些方面还要更好虽然认知能力还有一定的差距但我认为在未来十年左右也将缩小。人工智能发展中很重要的一点就是三要素里面的“算力”也即“计算”。摩尔定律已经遇到瓶颈因此现在的深度学习特别是大模型、大计算其算力不仅仅要达到摩尔定律而且要超越摩尔定律。它们每年的计算需求几乎达到10倍增长。例如GPT-3它是1000多亿参数的大模型。OpenAI团队后面没有资金继续做微软投资把GPT-3模型训练出来。中国和美国在这个领域你追我赶。鹏城的盘古、智源的悟道、浪潮的“源1.0”、微软-AMD的图灵不管是算力还是参数、数据都比GPT-3大很多。在此方面GPT-4可能也会马上出现一旦出现我认为中国的企业、科研机构也会超越GPT-4。这是一个好现象中美两国在这个行业的科技、产业方面形成良性竞争对整个行业的发展都是有益的。IT产业有三个定律一个是香农定律一个是冯·诺依曼架构另外一个是摩尔定律。我们现在所做的就是突破这三个极限特别是冯·诺依曼架构它已经被使用了将近60年依然是目前计算的主流架构。在人工智能时代它有诸多局限现在很多科研、产业都在想怎么去突破它。比如在听觉、视觉、触觉、味觉之外打造新的感知如激光雷达、三维结构、光传感、生物的传感另外我们有新的数据流需要海量的并行计算包括AI的一些算法如矩阵、算子、波尔代数等都需要超越冯·诺依曼架构。我们看到很多新兴科研产品出现一些非传统的芯片公司现在也都进入了芯片和程序库领域。长期来看我们需要突破计算的范式。目前类脑计算、量子计算、光计算、生物计算都有重大进展在空间分布方面我们的计算也有很大变化最早IBM大型机是完全的中央计算PC阶段则变为完全分布式的到云计算时又回到中央式的现在我们正走向云边端的协同智能。未来许多计算将走向边缘我相信在未来十年中90%以上的计算能力可能会到边缘整个计算会更动态化、分布化。AI生命科学下面我简单讲人工智能在三个领域的应用也是我们主要在做的一些科研工作。在生命科学领域一是刚才讲过生物世界在数字化产生了天文级的组学数据基因组学蛋白质组学转录组学细胞组学这些组学数据再加上各种组合带来的数量是天文级的。二是整个生物的实验干实验和湿实验完全闭合会走向自动化未来越来越少的人介入这是在实验范式上很大的突破。三是人工智能科学计算我们现在生物世界里面更多的是分子动力学未来AI将走进科学计算。简单看一下AI在生命科学方面的进展第一个是基因编辑编辑的基底清楚之后AI的算法可以更精准的找到治病基因治疗的方式让靶点更加准确。其实就是把这个搜索空间大大的减少了。另外我们不仅仅可以做小分子的制药也可以做大分子抗体以及TCR个性化的疫苗和药物还有我们看到最近AlphaFold在蛋白质解析方面的进展从一维的序列到三维的结构到功能都会加速发展。其次随着高通量自动化的实验发展新的范式正在构成。最近新冠疫苗的研发就是一个例子从2020年1月基因的序列被发布之后可以看到3个月之后蛋白质的结构很快就解析出来了1个月之后病毒和人的交互方式就被解析了很快灭活疫苗研发成果这在人类历史上是最快的一个周期仅不到一年时间我们的疫苗就出来了。另外一个工作是我们彭健教授所做的根据目前我们已有的肿瘤细胞系上药物数据加上动物的模型、老鼠的模型产生的数据来预测药效。因为人类的这些数据比较少可解释型的机器学习能够很快的去迁移到人体内药效预测上。右边是乳腺癌患者的实例可以看到用这样的方式不仅仅加快研发速度而且对于药物推荐使用的准确度也提高了5倍。另外一个例子是我们最近也是彭健教授团队用几何深度学习先把蛋白质表面的几何表征训练起来然后用深度的图网络来做抗体亲和力预测。我们抗体设计不仅仅在过程上加速了很多也已经成功的应用到新冠的中和抗体药物的开发上。还有我们在基因大数据方面的工作由兰艳艳教授带领学生完成我们现在知道基因10%是已经编码的90%是没有编码的这些开放区域与转录因子的结合以及和目标基因的调控关系最终会影响生物的性状。但这些数据过去大家都不用也不知道怎么用。那我们现在通过人工智能最前沿的预训练技术通过构造一个全新的模态建立基因数据的有效表达继而对下游的基因表达预测剪切预测治病性预测等任务都有显著的帮助。这个工作刚刚开始未来还有很大的发展空间。很重要的是我们发现这里面有非常大的挑战我们做人工智能或者说计算机科学和生命科学是两个不同的语言体系。过去的合作方式都是比较机械的或者是生物科学家去调程序包或者把算法用到生命科学领域。为了打通两个领域我们做了一系列的工作从硬件层到数据层然后到算法层这些工作叫“破壁计划”。这方面很好的例子是AlphaFold。首先第一点问题——从蛋白质一维序列到三维结构它是一个科学的问题第二点的话就是每次破解蛋白质的结构之后大家把数据拿出来共享就可以看到积累的数据越来越多。随着数据更多、算力更大、算法更新我们希望做的是把这样的一种方法论用到更广阔的领域不仅是蛋白质还有抗体、基因预测等方面。AI绿色计算人工智能在绿色计算双碳领域也有重要的的应用。当环境与气候已经成为一种挑战碳中和是可持续发展的必然选择同时也是能源结构调整的大机遇。人工智能在这个领域也有很多应用。一个方向是物联网做AIOT重要的是要感知这个世界知道碳排放、能源从哪里来、怎么消耗的第二有了数据之后就可以用算法进行智能决策然后配制资源、进行资源循环。比如在能源融合方面怎样让火电、核电、水电、风电、太阳能更好地融合到电网里去在供电、储能、用电各环节都进行数据监控、优化、感知和均衡这是大问题人工智能算法会在其中扮演不同角色。讲到双碳排放IT行业和ICT行业也是一个大的排放源。我和团队讲先把我们自己的排放问题解决了数据中心运行的大数据、大计算产生了很多排放5G本身是特别好的技术但由于需要很多基站、天线所以功耗也比较高另外大的算法、模型也有很多排放。我们近期的一个工作是5G基站。众所周知5G用的Massive MIMO里面有很多基站这样计算一下比如50个基站就有64个MIMO组合数就很高了正常应用的时候还要做最优的布阵、部署有很多种可能性数量绝对会达到天文级。我们最近做了一些工作是真实的基站加上一些模拟的场景用多Multi-agent cooperative Contextual Bandits这个算法其实也不是特别复杂也包括一些离散正向学习算法使得功耗降低了15%左右、5G网络覆盖质量提高了5%左右。这个工作其实才刚刚开始我想告诉大家人工智能算法在很多领域都会有应用应用之后可以起到很好的效果。另一个工作更理论化现在的大模型、大数据、大计算能否也走向另一端即小模型、小计算、小功耗在边缘处用传感器或手机就可以做类似的计算。当然精度可以低一点比如80%、90%但功耗、计算量、模型可能是百分之一、甚至是千分之一。其中很多大家可能都比较熟悉像蒸馏、压缩、量化对模型本身进行重新优化和部署。AI自动驾驶最后是人工智能在自动驾驶方面的应用这也是我自己研究时间比较多的领域。汽车产业已有上百年的历史这个产业最近在经历百年未有之大变局无论产业结构还是技术要素都进入了新阶段。其中智能化是无人驾驶最关键的环节。为什么这么说首先是更安全90%以上的交通事故是人为事故而自动驾驶可以把它降到最低其次是更绿色它的效率更高可以节能减排。我认为自动驾驶也是人工智能领域目前最有挑战、最难、最复杂的一个技术问题但同时可以解决。它是一个复杂的大系统但可以解剖成子问题逐个解决但如果没有边界的话可能就没法解决。最具挑战、但又有边界的是AI垂直领域问题。自动驾驶领域有一些关键的议题。这个领域有市场的力量也有非市场的力量市场力量包括技术是否可行、用户是否有需求、产业生态、商业模式等非市场的力量包括政策法规、伦理隐私等。在技术方面完全无人的L4级别自动驾驶究竟是梦想还是现实究竟是以视觉为主还是采取激光雷达多传感器的模式究竟是以单车智能为主还是需要车和路、车和车协同是渐进式跳跃L2、L3走上去还是直接跳跃到L4是像安卓一样开源还是像Apple一样封闭到底是现在的汽车OEM会赢得这场竞争还是造车新势力我注意到有很多的问题。要真正实现大规模无人驾驶还需要一些时间。我们开车的时候是在用最安全且实时的方式加上对时间的预测构建一个三维环境场景做这件事是很难的。其中很重要的是要有大量的数据、做很多测试、不断改进算法。实际驾驶中永远都会遇到此前训练中没有的场景。图片上就是这辆特斯拉撞上一辆白色卡车当时天气特别好蓝天白云它用视觉一看以为前面没有东西就直接撞上去了。很多时候AI必须能预测泛化的能力是人工智能的一个大挑战对自动驾驶、无人驾驶更加重要因为一旦出现问题就关乎生命安全。关于视觉与多传感器的问题我的观点是能拿到多少数据就拿多少数据。新的传感给我们提供了新的数据和新维度的信息AI的感知能力是唯一可以超过人类的点。摄像头、激光雷达或各种不同传感器可以看到人类眼睛看不到的东西这是AI的优势必须加以利用。运用视觉也可以实现无人驾驶但其本身的鲁棒性及安全性受限而用激光雷达加上算法就可以检测出深度的信息分辨车、行人分辨运动或不动的物体这就是有深度、有结构的物体信息。所以视觉摄像头和激光雷达相结合是最佳的方式。大家有顾虑认为激光雷达太贵了其实现在混合雷达价格已是可接受的。我想固态雷达一定会是未来的趋势L2、L3的车上也会用到。自动驾驶本身需要很强的智能交通灯和道路配合也可以提供更高维的数据车端和路端完全可以互补。有些东西车是看不到的车只能看到100多米而且经常会被遮挡交通灯则可以提供新的信息这对自动驾驶安全提供了很重要的保障。现在车的分级是从L0一直到L5L5就是完全无人可以在所有的场景、所有的气候中行驶。最近清华大学智能产业研究院AIR和百度有个联合项目把路也分成C0-C5到C4就是任何车都能无人驾驶但这是比较极端的情况我们希望最终的结果是车和路的融合。我们做的物理模型和数学模型也显示车和路协同能够大幅度提高安全性。在超距离跟车、换道、左转这三个不同场景中都可以看到路、灯的信息大幅度提高了车的安全程度。总结最后总结一下在前三次工业革命中蒸汽机时代、电气时代、信息时代我们都是跟随者、旁观者而现在进入第四次工业革命到了智能时代我们国家的体量、政策的优势、大量的科研人才一定能让我们成为第四次工业革命的领军者感谢大家。未来智能实验室的主要工作包括建立AI智能系统智商评测体系开展世界人工智能智商评测开展互联网城市大脑研究计划构建互联网城市大脑技术和企业图谱为提升企业行业与城市的智能水平服务。每日推荐范围未来科技发展趋势的学习型文章。目前线上平台已收藏上千篇精华前沿科技文章和报告。 如果您对实验室的研究感兴趣欢迎加入未来智能实验室线上平台。扫描以下二维码或点击本文左下角“阅读原文”