如何建设交流网站的论文,济南优化推广网站seo,wordpress edit_post_link,上海网络推广外包文#xff5c;郝 鑫
编#xff5c;刘雨琦 ChatGPT火爆之前#xff0c;水面下#xff0c;也有中国公司也在朝着智能助手的方向努力。夸克便是其中之一。在GPT风靡科技圈后#xff0c;国内就开始陆续冒出一些大模型厂商。对当时夸克而言#xff0c;做大模型毋庸置疑郝 鑫
编刘雨琦 ChatGPT火爆之前水面下也有中国公司也在朝着智能助手的方向努力。夸克便是其中之一。在GPT风靡科技圈后国内就开始陆续冒出一些大模型厂商。对当时夸克而言做大模型毋庸置疑但做什么样的大模型还需要结合自身优势去制定详细方案。本质上这是一个技术性和实用性谁是第一性的问题。同样是做大模型有的厂商选择先攻克技术大模型研发出来后再找业务场景而有的厂商则是从已有的确定性场景出发匹配满足业务需求的大模型。夸克显然属于后者从搜、存、用三个主要核心场景出发打造知识准确性高、逻辑理解能力强的大模型底座。事实上大模型问世之后落地速度并没有想象中那么快核心原因便在于找不到场景拿着锤子满世界找钉子效率自然不高。而夸克则从原有的场景出发产生价值是关键。正是源于这样的思考夸克大模型的诞生贯穿着实用性的思考也自我定位为面向搜索、生产力工具和资产管理助手的应用型大模型。更准确的说夸克借着大模型的技术东风将原有产品功能进行智能化升级也再次明确了打造集工作、生活、学习一体的AI助手的初心。
“学霸”是怎样炼成的
什么样的土壤结出什么样的果实夸克大模型从出生起就自带着搜索引擎的基因。搜索的本质是将用户的搜索意图和信息进行匹配而这也正是帮助大模型形成逻辑的过程。用户的每次查询、点击都会建立、强化和拓展匹配的关联性比如在浏览页面的过程中就能自然地建立起“ChatGPT-OpenAI-奥特曼”之间的关系。循环往复通过搜索就积累起了庞大的数据建立起了涵盖文字、图片、视频的多模态知识图谱正是在这些错综复杂的知识图谱中构建起了逻辑关系。可以说用户的每一次搜索行为都是在辅助大模型训练。基于此以Transformer为架构从搜索引擎中长出来的夸克大模型天然就擅于理解和逻辑。得益于在理解和逻辑上的天赋让夸克大模型确定了最核心的能力——知识正确性能力。“要开发大模型应用首先就要解决知识正确性的问题。现在内容生成主要靠大模型的创意能力而不是知识能力这可能拥有一部分市场。但更进一步我认为好用的大模型产品和创新产品应该是知识和创意能力的结合”夸克技术负责人蒋冠军表示。但从发现到构建这中间还需要解决两个核心问题一是如何降低幻觉提高大模型输出的准确率二是如何让大模型真的去理解和学会不止是学会更要做“学霸”。因此“学霸计划”正式确定成立夸克打出了一套组合拳。首先是参数要大夸克大模型参数达到了千亿级。更大的参数量意味着模型的知识容量更大可学习语言的模式也更丰富有利于大模型的分析和推理。其次是从数据价值上下功夫。从数量上做到全据悉夸克大模型几乎涵盖了所有的中文知识以及丰富的英语和其他语言知识从数据质量上做到优质基于搜索引擎经验夸克团队有一套科学的知识评估、对齐和校验体系可以筛选出哪些数据是有价值的同时过滤出无用、有害的数据从数据与数据关系层面采用大量知识图谱、文档和网页知识去做知识增强。最后是靠专业团队来生产和审核知识。在医疗、教育、文档行业夸克不仅沉淀了大量的数据还引进了专业的医生、老师等角色一边生产出专业优质的知识喂给大模型一边也为最后结果生成的准确性加筑了一道防线。蒋冠军告诉光锥智能靠专业团队供给大模型训练才让其走到了现在“最初我们做一个版本但是效果不太好。于是我们立马组建起专业团队不仅有正式员工、行业资深从业者也建设了专门的第三方团队”。不过真学霸还是假学霸还得拿成绩说话。在提升准确率方面夸克大模型在健康等高精专行业知识错误率降到了5%以下基本上达到较高可用性。在国内最权威的两个大语言模型测试榜单中夸克大模型经过了上万道专业考题的检验覆盖几十个学科和不同学段无论是常识问题还是社会科学知识夸克大模型都展现出了处理复杂、多层次问题的能力。 在C-Eval榜单中夸克大模型平均分达到89分位居榜单第一同时在社会科学、人文科学和其他三个类目中位列榜首。 在CMMLU榜单评测中夸克大模型以平均77.08分的成绩位列总成绩第一并占据社会科学和其他两个类目的首位。 临床执业医师资格考试、计算机等级考试、公务员考试、教师资格证考试夸克大模型摇身一变成了各领域的“专业人才”。
重要的是夸克是什么
一个以知识能力为核心兼具对话、创作、安全的锤子打造好后下一步就要考虑楔钉子的顺序以及怎么用大模型的底座把夸克的产品功能挨个智能化改造一遍。蒋冠军介绍他们对夸克的最新定位是一款集搜、用、存的智能信息产品。该定位来自于夸克团队对其主要用户群体即25岁以下的年轻用户长期使用场景的分析蒋冠军表示“在大家工作、学习和生活的过程中无外乎是找资料、存资料并且最好还能在云端进行编辑和加工”。梳理后发现“搜”的功能中包含了通用搜索、文档、图片、视频、医疗、教育等场景“用”的功能具体指所提供的工具其中有扫描王、高考填报、网页、资料生成等工具“存”则指向个人云盘系列功能内含了资产管理、资产搜索、资产编辑等功能。搜索一向是夸克的“灵魂”自然也成为了落下的第一颗“钉子”。对夸克来说“搜索”是引擎牵一发而动全身。因此对搜索的改造绝不能浅尝辄止。具体来看目前有三个主要方向的升级对通用搜索结果的优化对生成内容的增加以及对健康、教育和法律等核心场景的再产品化。过去用户在搜索引擎中的查询、点击和结果返回的行为本身就是一种交互方式只不过在这种情况下搜索不具备针对性搜索结果呈现也是散状的。而有了大模型以后搜索的行为更像是对话既可以展现通用的答案也可以针对用户个性化提问、追问进行补充。搜索结果可以聚合和整合不用再同时打开十几个网页并且结果正确性可追溯。夸克认为搜索本身就是一个以内容为驱动的产品AIGC技术趋渐成熟催化了搜索内容的进一步爆发。现阶段夸克在搜索上推出了大量的AIGC内容比如支持消息祝福、语文作文、合同、规章制度、新闻稿等短、中、长的文案创作。健康、教育和法律行业都是对知识性要求极高的行业。首先是有进入门槛如果没有长时间的行业积累很难把行业摸透做到深、精和专。再者用户对这些行业的知识需求量要足够大知识的难易程度要有阶梯性的区分。更为关键的是用户搜即用从学术写作、实验室到手术台、法院对准确性都有极高的要求。上述要求或许对其他玩家存在挑战但对夸克而言从行业经验、数据积累到知识的准确性本该水到渠成。“在健康场景上我们做了很多行业数据建设和知识建设具备完整的健康知识图谱储备了大量医典百科、医典问答的C端用户数据还整理了大量的指南、标准和书籍等一系列数据”蒋冠军说道。此外夸克的优势还在于有成熟的场景和用户。大模型对健康和法律行业的改造早在年初就在国外兴起也被视为具有潜力的市场。几乎同时期国内就出现了一批“Copy to China”的追随者但却忽略了本质逻辑国外能火是因为把昂贵的劳动力价格打了下来却不符合国内实际情况。所以直到现在仍有很多创业者在做2C还是2B场景中徘徊。然而对夸克来说做健康、法律、教育不是选择而是发挥之所长。蒋冠军告诉光锥智能“为什么我们要重点建设健康行业原因在于搜索引擎的核心群体就涵盖了对健康信息的强需求在搜索引擎上用户可以获得更好的信息服务。”夸克大模型之于健康知识查询、获取最大的变化在于不仅能做健康科普问答还具备比较好的推理能力。以一个咨询咳嗽症状的场景为例以前在搜索引擎的操作流程如下在搜索框输入“咳嗽了三天越来越严重了怎么回事儿”然后网页出现了一堆五花八门的答案有的说是感冒有的说是肺炎有的说是支气管炎问题是一点没解决还徒增了恐慌。夸克团队注意到上述情况存在着两个痛点普通用户缺乏专业知识不知道怎么精准地描述自己的症状同样一个小症状可能对应着一堆疾病怎么判断哪个是主要症状夸克给出的解决方案是线上给每位患者建立了“医疗卡”当用户简单描述了咳嗽的症状后会出现一系列相关的可能对应疾病症状。提交完后大模型会根据当前的症状信息给出一个疾病范围。通过交互和推理大幅度提升了诊断的精确性。最后大模型会输出参考信息给出几个参考方案如果是A种情况有什么症状确诊需要做哪些检查可能会开什么药等等。在工具、云盘功能方面当前夸克大模型的主要作用是提效。在云盘上夸克网盘相册可以用自然语言去完成检索背后是夸克大模型加持的多模态技术和能力在扫描产品上扫描识别、资料生成、AI智能填表等更多功能已经在升级和开发的路上。“夸克大模型基本上完成了在当前阶段的整体迭代具备在一部分夸克App的场景里提供服务的能力”蒋冠军总结道。
大模型是搜索引擎的未来吗
大模型之后微软、谷歌等都曾尝试重构搜索但目前为止并没有确定性的结果。这同样是夸克的挑战但也是巨大的机会。新一代的搜索引擎不单单只是一个冰冷的工具而是由用户来重新定义它可以是工作伙伴、情感陪伴、老师朋友。微软将之称之为“Copilot”副驾谷歌称之为“Magi”。谷歌表示搜索不仅仅是一个工具而是一个伙伴一个灵感来源一个创造力的催化剂搜索体验将成为重点。搜索引擎的角色定位变了。这一本质的改变会带动搜索引擎走向内容化的道路同时流量的分配逻辑和商业模式也会随之改变。“现在是大模型辅助搜索未来是大模型改变搜索。”蒋冠军表示搜索产品的本质就是“交互内容”把搜索做得极致简单就是一个“框内容”的形式但是搜索的局限性在于内容没法个性化和深度化别人生产什么它就回答什么。大模型诞生后搜索的内容生成能力实现了指数级增长交互提问的数量和理解能力也相应地指数级上升。下一代的搜索引擎将在内容联动性方面进一步打通以此来增加搜索内容的丰富性。除了现在能看到的文字、图片、视频以后还将会有短视频、社交媒体帖子、AI生成内容等内容排序与推荐顺序的决定权重新交还给用户。同时随着大模型的进一步的普及流量入口可能会从现在的搜索引擎转移到大模型的对话框这将会直接导致流量逻辑和规则的改变。换而言之未来谁掌握了大模型谁能吸引来更多用户使用其大模型就能掌握话语权。关于下一代搜索夸克也有自己的思考夸克认为搜索与大模型关系是随着技术成熟度而变化。蒋冠军判断到“5到10年以后搜索会有大变化”。他认为理论上来说只要大模型足够强会打破现有的很多信息获取习惯大模型都是可以使用的工具打字也好、语音也好跟它交互很方便。再进一步大模型的基础能力会越来越往搜索里面去渗透。先是大模型辅助搜索完成一些工作慢慢变成以大模型为核心用搜索帮它完成产品创新。搜索推荐、排序与流量入口改变以后搜索的商业模式必然会重塑。光锥智能发现商业模式渐进式的重塑已经打响例如谷歌在对话搜索生成的结果页同样呈现了商家广告推荐外媒报道微软、谷歌已经尝试在类ChatGPT对话生成结果中增加商家投放链接价高者排序也比较靠前。这让新一代搜索充满了想象力。也让夸克这位主攻信息服务的新星一跃成为阿里的创新代表之一。阿里三季度财报会上新任CEO吴泳铭宣布首批战略级创新业务夸克位列其中。从根本上看这源于阿里的“AI驱动”战略进一步吴泳铭曾在公开场合发言表示“在可见的未来会有更智能的下一代产品进入人们的生活AI助理会无处不在成为每个人工作、生活、学习中的助手”。在阿里内部“工作、生活、学习的助手”直指夸克无论从内部的重视程度还是行业重要性来看如今的夸克已经站在了下一代搜索的临界点。