当前位置: 首页 > news >正文

河北区网站建设icp备案官网查询

河北区网站建设,icp备案官网查询,设计素材网站会员,临湘网站到目前为止#xff0c;我强调了在开发应用程序时#xff0c;您通常会使用现有的LLM。这为您节省了大量时间#xff0c;并可以更快地得到一个工作原型。 但是#xff0c;有一种情况下#xff0c;您可能会发现有必要从头开始预训练自己的模型。如果您的目标领域使用的词汇和…到目前为止我强调了在开发应用程序时您通常会使用现有的LLM。这为您节省了大量时间并可以更快地得到一个工作原型。 但是有一种情况下您可能会发现有必要从头开始预训练自己的模型。如果您的目标领域使用的词汇和语言结构在日常语言中并不常用您可能需要进行领域适应以实现良好的模型性能。 例如想象一下您是一个开发人员正在构建一个应用程序帮助律师和律师助理总结法律摘要。法律写作使用了非常特定的术语如第一个例子中的mens rea和第二个例子中的res judicata。这些词在法律界外很少使用这意味着它们不太可能在现有LLM的训练文本中广泛出现。因此模型可能难以理解这些术语或正确使用它们。 另一个问题是法律语言有时在不同的上下文中使用日常词汇如第三个例子中的consideration。这与友善无关而是指的是使协议可执行的合同的主要元素。出于类似的原因如果您尝试在医疗应用中使用现有的LLM可能会遇到挑战。 医学语言包含许多不常用的词汇来描述医学状况和程序。这些可能不会经常出现在由网络抓取和书籍文本组成的训练数据集中。有些领域也以高度特异的方式使用语言。 这最后一个医学语言的例子可能只是一串随机字符但它实际上是医生用来写处方的速记。这段文字对于药剂师来说意义非凡意思是饭后和睡前口服一片每天四次。 因为模型通过原始预训练任务学习它们的词汇和语言理解所以从头开始预训练您的模型将为法律、医学、金融或科学等高度专业化的领域产生更好的模型。 现在让我们回到BloombergGPT首次在2023年由Bloomberg的Shijie Wu、Steven Lu和同事们在一篇论文中宣布。BloombergGPT是一个已经为特定领域预训练的大型语言模型的例子这个领域是金融。 Bloomberg的研究人员选择将金融数据和通用税务数据结合起来预训练一个在金融基准上取得最佳结果的模型同时在通用LLM基准上保持竞争性能。因此研究人员选择了由51%的金融数据和49%的公共数据组成的数据。 在他们的论文中Bloomberg的研究人员更详细地描述了模型的架构。他们还讨论了他们是如何从Chinchilla的缩放法则开始寻求指导以及他们在哪里不得不做出权衡。 这两张图比较了包括BloombergGPT在内的一些LLM与研究人员讨论的缩放法则。 左边对角线追踪了一系列计算预算的最佳模型大小以十亿参数为单位。 右边线追踪了计算最佳训练数据集大小以令牌数量为单位。 每张图上的虚线粉红线表示Bloomberg团队用于训练新模型的计算预算。 粉红色阴影区域对应于Chinchilla论文中确定的计算最佳缩放损失。 在模型大小方面您可以看到BloombergGPT大致遵循了给定计算预算为130万GPU小时或大约2.3亿petaflops的Chinchilla方法。模型只是略高于粉红色阴影区域表明参数数量接近最佳。 然而用于预训练BloombergGPT的实际令牌数量为5690亿低于可用计算预算的推荐Chinchilla值。小于最佳的训练数据集是由于金融领域数据的有限可用性。 显示实际约束可能迫使您在预训练自己的模型时做出权衡。 恭喜您完成了第一周的学习您已经涵盖了很多内容所以让我们花一分钟回顾一下您所看到的。 Mike带您了解了LLM的一些常见用途如写作、对话摘要和翻译。 然后他详细介绍了为这些模型提供动力的Transforms架构。 并讨论了您在推理时可以使用的一些参数来影响模型的输出。 他总结了一个您可以用来计划和指导应用程序开发工作的生成性AI项目生命周期。 接下来您看到了模型在一个称为预训练的初始训练阶段如何在大量的文本数据上进行训练。这是模型发展其语言理解的地方。 您探讨了训练这些模型的计算挑战这些挑战是很大的。 在实践中由于GPU内存限制您几乎总是在训练模型时使用某种形式的量化。 您本周结束时讨论了LLM的缩放法则以及如何使用它们设计计算最佳模型。 如果您想的细节请务必查看本周的阅读练习。 参考 https://www.coursera.org/learn/generative-ai-with-llms/lecture/BMxlN/pre-training-for-domain-adaptation
http://www.huolong8.cn/news/123285/

相关文章:

  • 网站代备案公司名称青岛做网站建设价格
  • 一套企业网站设计图片怀化 优化营商环境
  • 东莞凤岗做网站网站推广是怎么推广的
  • 网站建设二公司中国空间站成为全人类太空之家
  • 自己免费做网站(三)高校网站建设制度
  • 西安网站排名优化培训网站的优化什么做
  • seo网站推广有哪些如何在网站投放广告
  • 网站 会员管理营销模板WordPress
  • 赣州网站建设方案网站开发页面静态化技术
  • 贵州做网站kuhugz怎样把网站建设在国外
  • 专业的网站首页建设公司公章电子版在线制作
  • 如何做网课网站怎么样做淘宝优惠券网站
  • 手机网站用什么语言开发公司营销网站建设
  • 平面设计和网站运营外贸网站建设加推广
  • 天津网站建设价格国内做免费的视频网站有哪些
  • 一个网站需要多少网页代做关键词收录排名
  • 沧浪手机网站建设方案wordpress能用的插件吗
  • 网站建设代码怎么导入图片找人做网站都需要提供什么
  • 江永网站建设中国五大门户网站
  • 具有品牌的福州网站建设广州昨天发生重大新闻
  • 创新驱动发展战略的内容关键词排名优化免费
  • 做环卫车怎么做网站游戏交易网站开发
  • 中英网站模板做外卖系统哪家网站做的好
  • 网页qq登录记录网站长春推广公司
  • 网站建设公司成都做网站要学的东西
  • 英文自助建站东台网站开发
  • 安卓android下载安装漳州网站建设优化排名
  • 自己做的网站首页变成符号了wordpress2中文
  • 深圳专业网站建设公司好吗沧州网络
  • 网站有源代码如何做seo广州建设银行预约公积金网站