怎么在网站做浮动图标,北京中高风险地区名单,网页制作学什么软件好,做网站要要多少钱项目的由来
1、分类、抽取、序列标注、生成任务是自然语言处理的四大经典任务#xff0c;其中#xff0c;分类、抽取任务#xff0c;可以使用规则进行快速实现。而对于生成而言#xff0c;则与统计深度学习关系较为密切。 2、当前#xff0c;GPT系列#xff0c;自动文本…项目的由来
1、分类、抽取、序列标注、生成任务是自然语言处理的四大经典任务其中分类、抽取任务可以使用规则进行快速实现。而对于生成而言则与统计深度学习关系较为密切。 2、当前GPT系列自动文本生成、文本图像生成图像文本生成等魔幻主义大作频频上演。 3、目前开源的seq2seq模型项目晦涩难度不利于阅读与入门。 受此三个现实背景也正好在接触生成这个任务特做此项目。
项目链接 https://github.com/liuhuanyong/KerasSeq2seqGeneration
项目的构成
项目场景该项目以自动对诗为使用场景即用户给定上一句要求模型给出下一句是个较理想的生成例子。 项目代码结构 data.txt:为训练数据此处使用的是对联诗句数据 seq2seq_predict.py:使用seq2seq模型进行下一句生成的脚本 seq2seq_train.py:使用seq2seq模型进行生成的脚本 model/: config.txt:预训练时形成的一些关键参数如最大长度等字数等。 input_vocab.pkl:输入语句的字符索引 output_vovab.pkl:输出语句的字符索引此处将输入和输出进行区分成两个vocab可以用于不同语种翻译等场景如果不需要也可以合成一个。 s2s_model.h5:模型名称 image: lstm_seq2seq_model.png:序列生成模型网路结构图
项目的思想
采用character字级别通过搭建lstm-encoder和lstm-decoder进行seq2seq生成任务。
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-BufA3fET-1610005013745)(https://github.com/liuhuanyong/KerasSeq2seqGeneration/blob/master/image/lstm_seq2seq_model.png)]
项目的使用
1、python seq2seq_train.py,进行模型训练。 2、python seq2seq_predict.py,进行模型测试。
项目的总结
1本项目完成了一个基于keras实现的自动对诗文本生成功能。 2这是一个较为简单的入门级项目欢迎补充。
关于作者
如有自然语言处理、知识图谱、事理图谱、社会计算、语言资源建设等问题或合作可联系我 1、我的自然语言处理开源项目https://liuhuanyong.github.io 2、我的csdn技术博客https://blog.csdn.net/lhy2014 3、我的联系方式: 刘焕勇中国科学院软件研究所lhy_in_blcu126.com. 4、我的共享知识库项目刘焕勇事理类知识库数据集http://www.openkg.cn/organization/datahorizon. 5、我的工业项目刘焕勇以事理为核心的金融情报探索https://datahorizon.cn.