当前位置: 首页 > news >正文

商城网站大全百度手机app下载安装

商城网站大全,百度手机app下载安装,湖南搜索引擎推广平台,怎样介绍自己做的网站困惑度perplexity#xff1a;句子的概率的倒数。如果句子的概率越大#xff0c;说明这句话越符合人话的规律#xff0c;即p#xff08;句子#xff09;#xff0c;pp困惑度越小。模型对该句子就越不困惑。 通俗一点解释下就是#xff0c;困惑度表示的对于一篇文章来说…困惑度perplexity句子的概率的倒数。如果句子的概率越大说明这句话越符合人话的规律即p句子pp困惑度越小。模型对该句子就越不困惑。 通俗一点解释下就是困惑度表示的对于一篇文章来说我们有多不确定它是属于某个主题的。即主题的个数越多模型的困惑度就越低但是注意一点当主题数很多的时候生成的模型往往会过拟合所以不能单纯依靠困惑度来判断一个模型的好坏。这时候我们的另一个判断标准就有作用了。biubiu~一致性 困惑度可视化 def perplexity_visible_model(self, topic_num, data_num):description: 绘制困惑度-主题数目曲线param {type} return: # texts self.fenci_data()_, corpus self.weibo_lda()x_list []y_list []for i in range(1,topic_num):model_name ./lda_{}_{}.model.format(i, data_num)try:lda models.ldamodel.LdaModel.load(model_name)-perplexity lda.log_perplexity(corpus)print(perplexity)x_list.append(i)y_list.append(perplexity)except Exception as e:print(e)plt.xlabel(num topics)plt.ylabel(perplexity score)plt.legend((perplexity_values), locbest)plt.show()主题一致性coherence。更高的一致性分数表示更好的aspect可解释性意味着更有意义还有语义上更连贯。 def visible_model(self, topic_num, data_num):description: 可视化模型param :topic_num:主题的数量param :data_num:数据的量return: 可视化lda模型dictionary, _ self.weibo_lda()texts self.fenci_data()x_list []y_list []for i in range(1,topic_num):model_name ./lda_{}_{}.model.format(i, data_num)try:lda models.ldamodel.LdaModel.load(model_name)cv_tmp CoherenceModel(modellda, textstexts, dictionarydictionary, coherencec_v)x_list.append(i)y_list.append(cv_tmp.get_coherence())except:print(没有这个模型:{}.format(model_name))plt.plot(x_list, y_list)plt.xlabel(num topics)plt.ylabel(coherence score)plt.legend((coherence_values), locbest)plt.show()可借鉴网址 https://zhuanlan.zhihu.com/p/106982034 实战 #找到最佳k通过主题一致性得分去找 import tomotopy as tp tp.isa def find_k(docs,min_k1,max_k20,min_df2):#min_df 词语最少出现在两个文档中import matplotlib.pyplot as pltscores []for k in range(min_k,max_k):mdl tp.LDAModel(min_df min_df,k k,seed 555)#print(mdl,mdl)for words in docs:if words:mdl.add_doc(words)mdl.train(20)coh tp.coherence.Coherence(mdl)scores.append(coh.get_score())plt.plot(range(min_k,max_k),scores)plt.xlabel(number of topics)plt.ylabel(coherence)plt.show() find_k(docs df[words],min_k1,max_k40,min_df2) 通过图形我暂时将主题定为10个。其中的tomotopy可见网址tomotopy | 速度最快的LDA主题模型
http://www.yutouwan.com/news/472177/

相关文章:

  • 怎样建立销售网站wordpress 主机服务主题
  • 老外的网站怎么做seo关键词查询
  • 做网站有什么求个网站你明白的 知乎
  • 小说网站开发流程wordpress怎么换域名
  • 关于做暧暧的网站网站建设移交确认书
  • 平陆县网站建设wordpress可以放视频播放器
  • 网站运营做网页设计网站是做排行榜
  • 免费的站外推广wordpress resize
  • 网站开发需要几个域名网站建设文字资料
  • 网站模板文件扫描广告最多的网站
  • 正规的丹阳网站建设企业电子商务网站开发数据库设计
  • 专业的微商城网站建设本溪网站建设公司
  • 网上效果代码网站可以下载吗搜索引擎优化的基础是什么
  • 网站交互性郑州制作网站推荐
  • 吉安市建设局施工管理站网站wordpress怎么搭
  • 贵州省住房与城乡建设厅门户网站学校网站做网页飘窗怎么做
  • 网站网页切换怎么做的成都工装设计公司排名
  • 兴润建设集团有限公司网站怎么把电脑当服务器做网站
  • 做同城网站最赚钱广东企业宣传片制作公司
  • 快速建网站的软件中国电力建设集团网站群
  • 广元做网站站排名南宁网站建设-中国互联
  • 泰州网站制作公司山西网站制作应用
  • 网站建设培训目标装饰公司营销型网站
  • 网站安装模板平台搭建工具有哪些
  • 校园网站建设管理及责任表网站制作公司承担
  • 什么网站可以免费做兼职长沙建网站需要多少钱
  • 网站会员发展计划成免费的crm图片
  • 企业建设网站需注意哪些事项泗水网站建设
  • 如何检测网站开发商留有后门线上广告形式有哪些
  • 北京电子商务app网站建设大兴陕西西安网站建设公司