当前位置: 首页 > news >正文

汕头市广州新业建设有限公司网站煎蛋网 wordpress

汕头市广州新业建设有限公司网站,煎蛋网 wordpress,网站的安全检查怎么做,阿里巴巴网站建设免费一、余弦距离 1.1 余弦相似度 余弦相似度是用来衡量两个非零向量之间的夹角的余弦值。对于两个向量 A A A 和 B B B#xff0c;余弦相似度的计算公式为#xff1a; C o s i n e S i m i l a r i t y ( A , B ) A ⋅ B ∥ A ∥ ∥ B ∥ {\rm{Cosine Similarity }}\left( …一、余弦距离 1.1 余弦相似度 余弦相似度是用来衡量两个非零向量之间的夹角的余弦值。对于两个向量 A A A 和 B B B余弦相似度的计算公式为 C o s i n e S i m i l a r i t y ( A , B ) A ⋅ B ∥ A ∥ ∥ B ∥ {\rm{Cosine Similarity }}\left( {{\rm{A,B}}} \right) \frac{{A \cdot B}}{{\parallel A\parallel \parallel B\parallel }} CosineSimilarity(A,B)∥A∥∥B∥A⋅B​ 1.2 余弦距离Cosine Distance 余弦距离是余弦相似度的补数即 C o s i n e D i s t a n c e ( A , B ) 1 − C o s i n e S i m i l a r i t y ( A , B ) {\rm{Cosine Distance }}\left( {{\rm{A,B}}} \right) 1 - {\rm{Cosine Similarity }}\left( {{\rm{A,B}}} \right) CosineDistance(A,B)1−CosineSimilarity(A,B) 余弦距离的值范围在0到2之间越接近0表示两个向量越相似越接近2表示越不相似。 二、马氏距离 马氏距离是一种测量两个点之间距离的方法不同于欧几里得距离它考虑了数据的协方差。 定义设 x x x和 y y y是从均值为 μ \mu μ协方差矩阵为 Σ \Sigma Σ(0)的样本总体 π \pi π中抽取的两个样品 p p p维则 x x x到 y y y之间的平方马氏距离定义为 d 2 ( x , y ) ( x − y ) T Σ − 1 ( x − y ) {d^2}(x,y) {(x - y)^T}{{\bf{\Sigma }}^{ - 1}}(x - y) d2(x,y)(x−y)TΣ−1(x−y) 若协方差是单位矩阵即所有变量之间的协方差都为零那么数据的各个特征维度是相互独立的且每个特征的方差都等于1。在这种情况下马氏距离可以简化为欧式距离因为协方差矩阵的逆矩阵就是单位矩阵。 2.1 方差Variance 方差是用来度量单一随机变量的分散程度或波动性的统计量。衡量数据点与数据集均值之间的离散程度。方差越大数据点越分散对于随机变量 x x x其方差计算如下 V a r ( X ) σ x 2 1 n − 1 ∑ i 1 n ( x i − x ˉ ) 2 {\rm{Var}}(X) \sigma _x^2 \frac{1}{{n - 1}}\sum_{i1}^n (x_i - \bar{x})^2 Var(X)σx2​n−11​i1∑n​(xi​−xˉ)2 在计算样本方差时我们通常将分母中的除数设为 ( n − 1 ) (n - 1) (n−1) 而不是 n n n。这是因为计算样本方差的目的是估计总体方差而在估计过程中需要考虑样本的大小对估计精度的影响。这种校正的目的是为了更准确地估计总体方差因为样本方差通常会略微低估总体方差。 当将除数设为 ( n − 1 ) (n - 1) (n−1) 时称为自由度调整。自由度调整的原因在于样本中的数据点之间并不是完全独立的而是相互关联的。如果我们仅将除数设为 n n n那么样本方差可能会过低估计总体方差因为它没有考虑到样本中的这种关联性。 自由度调整考虑了这种关联性通过将除数设为 ( n − 1 ) (n - 1) (n−1) 来更准确地估计总体方差。这意味着我们不会过于乐观地估计总体方差从而更好地反映了总体的分散性。这对于统计推断和参数估计非常重要因为我们希望我们的估计尽可能接近总体参数的真实值。 总结一下自由度调整的目的是减小样本方差的偏差使其更接近总体方差的真实值从而提高统计估计的准确性。这是统计学中常见的惯例。 2.2 协方差Covariance 协方差用于度量两个随机变量之间的线性关系即它度量这两个变量如何一起变化。对于两个随机变量 X X X 和 Y Y Y它们的协方差可以用以下公式计算 σ ( x , y ) 1 n − 1 ∑ i 1 n ( x i − x ˉ ) ( y i − y ˉ ) \sigma(x, y) \frac{1}{{n - 1}} \sum_{i1}^n (x_i - \bar{x})(y_i - \bar{y}) σ(x,y)n−11​i1∑n​(xi​−xˉ)(yi​−yˉ​) 上述公式是样本协方差的计算方法。若有整个总体的数据可以将 (n - 1) 改为 n得到总体协方差。 C o v ( X , Y ) E [ ( X − μ x ) ( Y − μ y ) ] {\rm{Cov}}(X,Y) E\left[ {\left( {X - {\mu _x}} \right)\left( {Y - {\mu _y}} \right)} \right] Cov(X,Y)E[(X−μx​)(Y−μy​)] 正协方差表示两个变量正相关负协方差表示两个变量负相关零协方差表示两个变量不相关。 2.3 皮尔逊相关系数Pearson Correlation Coefficient 协方差的值可以为正、负或零但它本身并没有标准化因此很难用来比较不同数据之间的关系。为了更容易理解变量之间的关系通常会将协方差标准化为相关系数Correlation Coefficient也称为皮尔逊相关系数。相关系数的范围在 -1 到 1 之间更容易解释和比较不同数据集的关系为 -1 表示完全负相关1表示完全正相关0 表示没有线性关系。相关系数的计算公式如下: r C o v ( X , Y ) σ X σ Y r \frac{{{\rm{Cov}}(X,Y)}}{{{\sigma _X}{\sigma _Y}}} rσX​σY​Cov(X,Y)​ 其中 σ X {\sigma _X} σX​和 σ Y {\sigma _Y} σY​分别是 X X X和 Y Y Y标准差。
http://www.huolong8.cn/news/331921/

相关文章:

  • 网站主页设计教程北京网站建设百度排名
  • 出售企业网站备案资料揭阳网站制作价格
  • 泉州网站建设技术支持网站需求列表
  • 做网站是先做后台还是前端网页浏览器的缩写
  • html 网站新功能介绍开发电子商务网站的主流语言
  • 重庆勘察设计协会网站公益 建网站
  • 郑州企业网站快速优化多少钱做淘宝客如何引出图片到网站
  • 任丘网站建设公司上海定制网站建设推广
  • Wordpress加720云vr邢台seo技术
  • 在网站里面如何做支付工具wordpress实现mp4播放器
  • 有专门做房孑特卖的网站吗什么样的网站高大上
  • 做t恤的网站手机网站建设哪儿好
  • 淘宝联盟做返利网站wordpress cx-udy
  • 徐州智能建站怎么做深圳优化公司义高粱seo
  • 企业网站新闻wp怎么做做网站需要许可证吗
  • 专业的网站建设公哪家专业设计logo网站是平面设计不
  • 网站官网认证怎么做的五百丁简历模板免费
  • wordpress企业站模板下载维品网站建设
  • 哪个地区网站建设好软件开发培训机构前十
  • 优设计网站网站建设作业多少钱
  • 一级a做爰片免费网站网站主题和建设
  • 湖南衡阳网站建设wordpress弹窗下载
  • 门户网站维护怎么做扬州建设集团招聘信息网站
  • 基金从业培训网站wordpress提示更新
  • 龙华网站建设的公司公司简介模板免费word
  • 网站的建设和设计方案国内简约网站设计欣赏
  • 给网站写文章怎么做的网站建设维护 微信
  • 苏州网站开发公司兴田德润放心玉溪网站建设现状
  • 东莞网站建设设网站建设打造
  • 深圳建网站价格平面设计的软件叫什么