当前位置: 首页 > news >正文

wordpress数据库密码修改seo推广专员工作内容

wordpress数据库密码修改,seo推广专员工作内容,公司名字大全必过,安徽定制型网站建设推广工具篇 下面列了几个较为主流的分词工具#xff08;排名不分先后#xff0c;大家自行试用#xff09;#xff0c;相关的paper请在订阅号「夕小瑶的卖萌屋」后台回复【中文分词】领取。 1 Jieba 说到分词工具第一个想到的肯定是家喻户晓的“结巴”中文分词#xff0c;主…工具篇 下面列了几个较为主流的分词工具排名不分先后大家自行试用相关的paper请在订阅号「夕小瑶的卖萌屋」后台回复【中文分词】领取。 1 Jieba 说到分词工具第一个想到的肯定是家喻户晓的“结巴”中文分词主要算法是前面讲到的基于统计的最短路径词图切分近期还内置了百度飞桨的预训练模型大规模蒸馏的前沿分词模型。 github项目地址https://github.com/fxsjy/jieba 2 THULACTHU Lexical Analyzer for Chinese 由清华大学自然语言处理与社会人文计算实验室研制推出的一套中文词法分析工具包具有中文分词和词性标注功能。该工具所采用的分词模型为结构化感知机。更多算法细节请参考github项目和阅读论文原文。 github项目地址https://github.com/thunlp/THULAC 论文链接https://www.mitpressjournals.org/doi/pdf/10.1162/coli.2009.35.4.35403 使用示例 #THULAC #pip install thulac import thulacsentence 不会讲课的程序员不是一名好的算法工程师 thu1 thulac.thulac(seg_onlyTrue) #只分词 text thu1.cut(sentence, textTrue) #进行一句话分词 print(THULAC: text)#output #Model loaded succeed #THULAC: 不 会 讲课 的 程序员 不 是 一 名 好 的 算法 工程师 3 NLPIR-ICTCLAS汉语分词系统 北京理工大学海量语言信息处理与云计算工程研究中心大数据搜索与挖掘实验室 Big Data Search and Mining Lab.BDSMBIT发布。是基于层次HMM的分词库将分词、POS、NER等都纳入到了一个层次HMM的框架之下联合训练得到。 主页http://ictclas.nlpir.org/github 项目地址https://github.com/tsroten/pynlpir 使用示例 #NLPIR-ICTCLAS #pip install pynlpir import pynlpirsentence 不会讲课的程序员不是一名好的算法工程师 pynlpir.open() tokens [x[0] for x in pynlpir.segment(sentence)] print(NLPIR-TCTCLAS: .join(tokens)) pynlpir.close()#output #NLPIR-TCTCLAS: 不 会 讲课 的 程序员 不 是 一 名 好 的 算法 工程 4 LTP 哈工大出品同THULAC一样LTP也是基于结构化感知器Structured Perceptron, SP以最大熵准则学习的分词模型。 项目主页:https://www.ltp-cloud.com/github 项目地址https://github.com/HIT-SCIR/ltp 论文链接http://jcip.cipsc.org.cn/CN/abstract/abstract1579.shtml 使用示例使用前需下载分词模型http://ltp.ai/download.html 5 HanLP HanLP是随《自然语言处理入门》配套开源的一系列NLP算法库。除了经典的1.x版本在不断迭代更新以外今年还全新推出了2.0版本。1.x版本有有基于词典的分词工具和基于CRF的切词模型。2.0版本开源了基于深度学习算法的分词工具。 1.x版本 github项目地址https://github.com/hankcs/pyhanlp 2.0版本 github地址https://github.com/hankcs/HanLP/tree/doc-zh 使用示例要求Python 3.6以上使用 #HanLP #v2.0 #pip install hanlp import hanlpsentence 不会讲课的程序员不是一名好的算法工程师 tokenizer hanlp.load(PKU_NAME_MERGED_SIX_MONTHS_CONVSEG) tokens tokenizer(sentence) print(hanlp 2.0: .join(tokens)) #output #hanlp 2.0: 不 会 讲课 的 程序员 不 是 一 名 好 的 算法 工程 6 Stanford CoreNLP 斯坦福推出的切词工具可以支持多种语言。算法核心是基于CRF模型。 github项目地址https://github.com/Lynten/stanford-corenlp 论文链接https://nlp.stanford.edu/pubs/sighan2005.pdf 使用示例需要先从stanford官网下载中文切词模型https://stanfordnlp.github.io/CoreNLP/ ###stanford CoreNLP #pip install stanfordcorenlp from stanfordcorenlp import StanfordCoreNLPsentence 不会讲课的程序员不是一名好的算法工程师 with StanfordCoreNLP(rstanford-chinese-corenlp-2018-10-05-models, langzh) as nlp:print(stanford: .join(nlp.word_tokenize(sentence)))
http://www.huolong8.cn/news/142852/

相关文章:

  • 网站 分辨率网站添加微博
  • 制作和维系一个网站的费用游戏代理平台免费
  • 镇江做网站哪家公司好做外贸到什么网站上发布比较好
  • 国外网站怎么上网站建设兼容性
  • 外贸网站的作用有哪些wordpress添加文章封面
  • 网站建设与管理的内容石家庄网站建设加q.479185700
  • 全屏自适应网站模板安卓盒子做网站
  • 怎么设置自己做的网站吗端 传媒网站模板
  • 企业网站建设原则是科技酒店
  • 昆明网站开发多少钱免费建站 永久
  • 湘潭公司网站建设Wordpress屏蔽模仿站爬虫ip
  • 品牌宣传网站制作阳江建设网站
  • 网站管理员权限有哪些360指数查询
  • 网站为什么做等保初中作文网
  • 有哪些中文域名网站上海建科建设监理网站
  • 建网站问题网站建设中 html5 模板下载
  • 网站文章要求合肥网站设计建
  • 域名查询ip网站35岁以后的程序员有多惨
  • 高端网站制作公司wordpress更改自定义文章页面
  • 国内最佳网站建设设计淄博网站建设选哪家
  • 淄博比较好的网站建设公司一个云主机 多个网站
  • 帝国网站后台管理系统dw网页设计代码案例
  • 手机网站单页面中企动力总部
  • 星月教你做网站的文档网站需求清单
  • 江苏省建设厅网站职称评审系统wordpress 分类导航插件
  • 做网站犯法了 程序员有责任吗毕业设计做网站论文
  • 免费绑定域名的建站wordpress自定义评论
  • 做网络课程的网站wordpress调用标题
  • 网站开发用户自定义排序方案如何搭建网站平台
  • 网站开发兼容性怎样建设网站后台