当前位置: 首页 > news >正文

厦门网站建设找哪家比较好网站设计设

厦门网站建设找哪家比较好,网站设计设,长春鸿祥建设有限公司网站,sqlite做网站数据库Llama 2是开源LLM发展的一个巨大里程碑。最大模型及其经过微调的变体位居Hugging Face Open LLM排行榜#xff08;https://huggingface.co/spaces/HuggingFaceH4/open_llm_leaderboard#xff09;前列。多个基准测试表明#xff0c;就性能而言#xff0c;它正在接近GPT-3.5…        Llama 2是开源LLM发展的一个巨大里程碑。最大模型及其经过微调的变体位居Hugging Face Open LLM排行榜https://huggingface.co/spaces/HuggingFaceH4/open_llm_leaderboard前列。多个基准测试表明就性能而言它正在接近GPT-3.5在某些情况下甚至超过它。所有这些都意味着对于从RAG系统到Agent的复杂LLM应用程序开源LLM是一种越来越可行和可靠的选择。 一、Llama-2–7B不擅长从文本到SQL 最小的Llama 2模型7B参数有一个缺点是它不太擅长生成SQL因此它不适用于结构化分析示例。例如我们尝试在给定以下提示模板的情况下提示Llama 2生成正确的SQL语句 You are a powerful text-to-SQL model. Your job is to answer questions about a database. You are given a question and context regarding one or more tables. ​You must output the SQL query that answers the question.​### Input:{input}​### Context:{context}​### Response: 在这里我们使用sqlcreatecontext数据集https://huggingface.co/datasets/b-mc2/sql-create-context的一个示例来测试一下效果 input: In 1981 which team picked overall 148?context: CREATE TABLE table_name_8 (team VARCHAR, year VARCHAR, overall_pick VARCHAR) 同时这里是生成的输出与正确输出的对比 Generated output: SELECT * FROM table_name_8 WHERE 1980 YEAR AND TEAM Boston Celtics ORDER BY OVERALL_PICK DESC LIMIT 1;​Correct output: SELECT team FROM table_name_8 WHERE year 1981 AND overall_pick 148 这显然并不理想。与ChatGPT和GPT-4不同原始的Llama 2不能生成期望的的格式和正确的SQL。 这正是微调的作用所在——如果有一个合适的文本到SQL数据的语料库我们可以教Llama 2更好地从自然语言生成SQL输出。微调有不同的方法可以更新模型的所有参数比如全量微调也可以冻结大模型参数仅微调附加参数比如LoRA。 二、微调Llama-2–7B使其可以从文本生成SQL 接下来我们将展示如何在文本到SQL数据集上微调Llama 2然后使用LlamaIndex的功能对任何SQL数据库进行结构化分析。 准备工作 微调数据集来自Hugging Face的b-mc2/sql-create-contexthttps://huggingface.co/datasets/b-mc2/sql-create-context base模型OpenLLaMa 的open_lama_7b_v2https://github.com/openlm-research/open_llama 步骤1加载微调LLaMa的训练数据 PS1以下代码来自doppel-bothttps://github.com/modal-labs/doppel-bot2许多Python代码都包含在src目录中3需要设置一个Modal帐户并生成token。 !pip install -r requirements.txt 首先我们使用Modal加载b-mc2/sql-create-context数据集并将其格式化为.jsonl文件。 modal run src.load_data_sql --data-dir data_sql 结果如下所示 # Modal stubs allow our function to run remotelystub.function( retriesRetries( max_retries3, initial_delay5.0, backoff_coefficient2.0, ), timeout60 * 60 * 2, network_file_systems{VOL_MOUNT_PATH.as_posix(): output_vol}, cloudgcp,)def load_data_sql(data_dir: str data_sql): from datasets import load_dataset​ dataset load_dataset(b-mc2/sql-create-context)​ dataset_splits {train: dataset[train]} out_path get_data_path(data_dir)​ out_path.parent.mkdir(parentsTrue, exist_okTrue)​ for key, ds in dataset_splits.items(): with open(out_path, w) as f: for item in ds: newitem { input: item[question], context: item[context], output: item[answer], } f.write(json.dumps(newitem) \n) 步骤2运行微调脚本 在微调数据集微调llama2模型代码如下 modal run src.finetune_sql --data-dir data_sql --model-dir model_sql 微调脚本会执行以下步骤 将数据集拆分为训练和验证拆分 train_val data[train].train_test_split(test_sizeval_set_size, shuffleTrue, seed42)train_data train_val[train].shuffle().map(generate_and_tokenize_prompt)val_data train_val[test].shuffle().map(generate_and_tokenize_prompt) 将每个拆分为元组的格式输入Prompt、标签输入query和上下文被格式化为输入Prompt然后对输入Prompt和标签进行 tokenize模型采用自回归的方法预测下一个token来进行训练。 def generate_and_tokenize_prompt(data_point): full_prompt generate_prompt_sql( data_point[input], data_point[context], data_point[output], ) tokenized_full_prompt tokenize(full_prompt) if not train_on_inputs: raise NotImplementedError(not implemented yet) return tokenized_full_prompt PS输入Prompt与开始测试llama2的格式完全相同。 运行微调脚本时模型将保存在model_dir指定的远程云目录中如果未指定则设置为默认值。 步骤3评估微调后模型 该模型已经进行了微调可以从云端提供服务。下面我们使用b-mc2/sql-create-context中的示例数据进行一些基本评估比较微调后模型与原始Llama 2模型的性能。 modal run src.eval_sql::main 结果表明微调后的模型有了巨大的改进 Input 1: {input: Which region (year) has Abigail at number 7, Sophia at number 1 and Aaliyah at number 5?, context: CREATE TABLE table_name_12 (region__year_ VARCHAR, no_5 VARCHAR, no_7 VARCHAR, no_1 VARCHAR), output: SELECT region__year_ FROM table_name_12 WHERE no_7 abigail AND no_1 sophia ANDno_5 aaliyah}Output 1 (finetuned model): SELECT region__year_ FROM table_name_12 WHERE no_7 abigail AND no_1 aaliyah AND no_5 sophiaOutput 1 (base model): SELECT * FROM table_name_12 WHERE region__year 2018 AND no_5 Abigail AND no_7 Sophia AND no_1 Aaliyah;​​Input 2: {input: Name the result/games for 54741, context: CREATE TABLE table_21436373_11 (result_games VARCHAR, attendance VARCHAR), output: SELECT result_games FROM table_21436373_11 WHERE attendance 54741}Output 2 (finetuned model): SELECT result_games FROM table_21436373_11 WHERE attendance 54741Output 2 (base model): SELECT * FROM table_21436373_11 WHERE result_games name AND attendance 0; 步骤4将微调模型与LlamaIndex集成 我们现在可以在LlamaIndex中使用这个模型在任何数据库上进行文本到SQL。 我们首先定义一个测试SQL数据库然后可以使用该数据库来测试模型的推理能力。 我们创建了一个玩具city_stats表其中包含城市名称、人口和国家信息并用几个示例城市填充它。 db_file cities.dbengine create_engine(fsqlite:///{db_file})metadata_obj MetaData()# create city SQL tabletable_name city_statscity_stats_table Table( table_name, metadata_obj, Column(city_name, String(16), primary_keyTrue), Column(population, Integer), Column(country, String(16), nullableFalse),)metadata_obj.create_all(engine) 这存储在cities.db文件中。 然后我们可以使用Modal将微调后的模型和该数据库文件加载到LlamaIndex中的NLSQLTableQueryEngine中——该查询引擎允许用户轻松地开始在给定的数据库上执行文本到SQL。 modal run src.inference_sql_llamaindex::main --query Which city has the highest population? --sqlite-file-path nbs/cities.db --model-dir model_sql --use-finetuned-model True 我们得到如下回复 SQL Query: SELECT MAX(population) FROM city_stats WHERE country United StatesResponse: [(2679000,)] 三、结论 本文提供了一种非常高级的方法来开始微调生成SQL语句的Llama 2模型并展示了如何使用LlamaIndex将其端到端插入到文本到SQL工作流中。 参考文献 [1] https://blog.llamaindex.ai/easily-finetune-llama-2-for-your-text-to-sql-applications-ecd53640e10d [2] https://github.com/run-llama/modal_finetune_sql [3] https://github.com/run-llama/modal_finetune_sql/blob/main/tutorial.ipynb
http://www.huolong8.cn/news/117285/

相关文章:

  • 河南做酒店网络系统网站免费的好看图片
  • 做网站用html好还是vue好wordpress缺少功能
  • 商城网站源代码深圳做网站找谁
  • 广东省住房和建设网站张家港安监站网址
  • 做互联网交易网站的条件互联网营销行业前景
  • 直流分公司四川建设部网站站长工具中文
  • h5页面 个人网站大学生50个创新产品设计
  • 微商城网站建设哪家好精品网游
  • 网站运营招聘要求动漫网站建设的目的
  • server 2008 网站部署WordPress开发微信支付
  • 遵义市住房和城乡建设局官方网站it行业公司排名
  • 基于j2ee的网站开发设计开题报告外贸模板网站深圳
  • 泉州做网站公司网站建设整改落实情况
  • 网站建设 服务内容免费动图制作app
  • 潼南集团网站建设seo优化方案策划书
  • 南通建设招聘信息网站一个公司的网站怎么做
  • asp网站开发人员招聘特效型网站
  • 网站营销推广如何做12306网站为什么做不好
  • 企业宣传片制作公司哪家好百度网站的优化方案
  • 2017网站开发前景网站怎样做平面设计图
  • 信息公司网站建设方案+游戏建设部网站被黑
  • 免费外链代发网站后端性能优化措施
  • 上传到网站去的文档乱码手机电脑网站 建站程序
  • 为切实加强 网站建设兵团建设环保局网站
  • 网站建设推广方法在线免费crm黑白配
  • 网站权重查看乡村网站建设
  • 哈尔滨做网站哪家好强注册网站域名用什么好处
  • 怎样建立自己网站视频网站百度权重查询网站
  • 网站程序更换注册城乡规划师有什么用
  • 免费装修效果图网站安防网站源码