返回

拓端tecdat|r语言有限正态混合模型EM算法的分层聚类、分类和密度估计及可视化

发布时间:2022-11-16 17:53:34 278
# 软件# 信息# 软件

简介

本文介绍了基于有限正态混合模型在r软件中的实现,用于基于模型的聚类、分类和密度估计。提供了通过EM算法对具有各种协方差结构的正态混合模型进行参数估计的函数,以及根据这些模型进行模拟的函数。此外,还包括将基于模型的分层聚类、混合分布估计的EM和贝叶斯信息准则(BIC)结合在一起的功能,用于聚类、密度估计和判别分析的综合策略。其他功能可用于显示和可视化拟合模型以及聚类、分类和密度估计结果。

聚类

  1.   
  2.  head(X)
pairs(X)-

拓端tecdat|r语言有限正态混合模型EM算法的分层聚类、分类和密度估计及可视化_r语言

  1.  
  2.  plot(BIC)
  3.   
  4.  

拓端tecdat|r语言有限正态混合模型EM算法的分层聚类、分类和密度估计及可视化_r语言_02

  1.  
  2.   
  3.  summary(BIC)

拓端tecdat|r语言有限正态混合模型EM算法的分层聚类、分类和密度估计及可视化_r语言_03

summary(mod1, parameters = TRUE)

 

拓端tecdat|r语言有限正态混合模型EM算法的分层聚类、分类和密度估计及可视化_d3_04

 

拓端tecdat|r语言有限正态混合模型EM算法的分层聚类、分类和密度估计及可视化_d3_05

plot(mod1)

拓端tecdat|r语言有限正态混合模型EM算法的分层聚类、分类和密度估计及可视化_d3_06

  1.  table(class, classification)
  2.  
  3.   
  4.  plot(mod1, what = "uncertainty")

拓端tecdat|r语言有限正态混合模型EM算法的分层聚类、分类和密度估计及可视化_r语言_07

  1.  clustICL(X)
  2.  summary(ICL)

拓端tecdat|r语言有限正态混合模型EM算法的分层聚类、分类和密度估计及可视化_聚类_08

  1.  
  2.   
  3.  BootstrapLRT(X)
  4.   

初始化

使用EM算法进行最大似然估计。EM的初始化是使用从聚类层次结构聚类中获得的分区来进行的。

  1.  
  2.  hclust(X, use = "SVD"))
  3.   

拓端tecdat|r语言有限正态混合模型EM算法的分层聚类、分类和密度估计及可视化_d3_09

clustBIC(X, initialization )) # 默认

 

拓端tecdat|r语言有限正态混合模型EM算法的分层聚类、分类和密度估计及可视化_r语言_10

拓端tecdat|r语言有限正态混合模型EM算法的分层聚类、分类和密度估计及可视化_r语言_11

hc2

拓端tecdat|r语言有限正态混合模型EM算法的分层聚类、分类和密度估计及可视化_d3_12

clustBIC(X, initialization )

 

拓端tecdat|r语言有限正态混合模型EM算法的分层聚类、分类和密度估计及可视化_聚类_13

hclust(X, model= "EEE"))

 

拓端tecdat|r语言有限正态混合模型EM算法的分层聚类、分类和密度估计及可视化_d3_14

  1.   
  2.  summary(BIC3)

 

拓端tecdat|r语言有限正态混合模型EM算法的分层聚类、分类和密度估计及可视化_聚类_15

通过合并最佳结果来更新BIC。

BIC(BIC1, BIC2, BIC3)

拓端tecdat|r语言有限正态混合模型EM算法的分层聚类、分类和密度估计及可视化_d3_16

拓端tecdat|r语言有限正态混合模型EM算法的分层聚类、分类和密度估计及可视化_聚类_17

使用随机起点进行单变量拟合,通过创建随机集聚和合并最佳结果获得。

  1.   
  2.  for(j in 1:20)
  3.  {
  4.   rBIC <- mclustBIC(
  5.   initi ))
  6.   BIC <- update(BIC, rBIC)
  7.  }

拓端tecdat|r语言有限正态混合模型EM算法的分层聚类、分类和密度估计及可视化_聚类_18

  1.  
  2.  clust(ga, BIC)

拓端tecdat|r语言有限正态混合模型EM算法的分层聚类、分类和密度估计及可视化_聚类_19

分类

EDDA

  1.  X <- iris[,1:4]
  2.  head(X)

拓端tecdat|r语言有限正态混合模型EM算法的分层聚类、分类和密度估计及可视化_聚类_20

clustDA(X, class,  "EDDA")

拓端tecdat|r语言有限正态混合模型EM算法的分层聚类、分类和密度估计及可视化_d3_21

  1.   
  2.  plot(mod2)
  3.  

拓端tecdat|r语言有限正态混合模型EM算法的分层聚类、分类和密度估计及可视化_d3_22

拓端tecdat|r语言有限正态混合模型EM算法的分层聚类、分类和密度估计及可视化_聚类_23

MclustDA

  1.  
  2.   
  3.  table(class)
  4.   

拓端tecdat|r语言有限正态混合模型EM算法的分层聚类、分类和密度估计及可视化_聚类_24

head(X)

拓端tecdat|r语言有限正态混合模型EM算法的分层聚类、分类和密度估计及可视化_聚类_25

clustDA(X, class)

拓端tecdat|r语言有限正态混合模型EM算法的分层聚类、分类和密度估计及可视化_聚类_26

  1.   
  2.  plot(mod3, 2)
  3.   
  4.  

 

拓端tecdat|r语言有限正态混合模型EM算法的分层聚类、分类和密度估计及可视化_r语言_27

  1.  
  2.   
  3.  plot(mod3, 3)
  4.  

拓端tecdat|r语言有限正态混合模型EM算法的分层聚类、分类和密度估计及可视化_聚类_28

交叉验证误差

  1.  
  2.  cv(mod2, nfold = 10)

拓端tecdat|r语言有限正态混合模型EM算法的分层聚类、分类和密度估计及可视化_r语言_29

拓端tecdat|r语言有限正态混合模型EM算法的分层聚类、分类和密度估计及可视化_聚类_30

  1.   
  2.  unlist(cv[3:4])

 

拓端tecdat|r语言有限正态混合模型EM算法的分层聚类、分类和密度估计及可视化_d3_31

cv(mod3, nf = 10)

拓端tecdat|r语言有限正态混合模型EM算法的分层聚类、分类和密度估计及可视化_聚类_32

 

拓端tecdat|r语言有限正态混合模型EM算法的分层聚类、分类和密度估计及可视化_r语言_33

  1.   
  2.  unlist(cv[3:4])

拓端tecdat|r语言有限正态混合模型EM算法的分层聚类、分类和密度估计及可视化_聚类_34

密度估计

单变量

clust(acid)

拓端tecdat|r语言有限正态混合模型EM算法的分层聚类、分类和密度估计及可视化_r语言_35

 

拓端tecdat|r语言有限正态混合模型EM算法的分层聚类、分类和密度估计及可视化_聚类_36

  1.   
  2.  plot(mod4, "BIC")
  3.  

拓端tecdat|r语言有限正态混合模型EM算法的分层聚类、分类和密度估计及可视化_聚类_37

  1.  plot(mod4, "density", acidity)
  2.   

拓端tecdat|r语言有限正态混合模型EM算法的分层聚类、分类和密度估计及可视化_聚类_38

  1.  
  2.   
  3.  plot(mod4, "diagnostic", "cdf")
  4.  

拓端tecdat|r语言有限正态混合模型EM算法的分层聚类、分类和密度估计及可视化_d3_39

多变量

  1.  clu(faithful)
  2.  summary(mod5)

拓端tecdat|r语言有限正态混合模型EM算法的分层聚类、分类和密度估计及可视化_聚类_40

  1.   
  2.  plot(mod5, "BIC")
  3.  

拓端tecdat|r语言有限正态混合模型EM算法的分层聚类、分类和密度估计及可视化_d3_41

拓端tecdat|r语言有限正态混合模型EM算法的分层聚类、分类和密度估计及可视化_r语言_42

  1.  
  2.   
  3.   
  4.  plot(mod5, "density",faithful)
  5.   
  6.   
  7.  

拓端tecdat|r语言有限正态混合模型EM算法的分层聚类、分类和密度估计及可视化_r语言_43

Bootstrap推理

  1.  
  2.  summary(boot1, what = "se")

 

拓端tecdat|r语言有限正态混合模型EM算法的分层聚类、分类和密度估计及可视化_d3_44

 

拓端tecdat|r语言有限正态混合模型EM算法的分层聚类、分类和密度估计及可视化_r语言_45

summary(boot1, what = "ci")

 

拓端tecdat|r语言有限正态混合模型EM算法的分层聚类、分类和密度估计及可视化_聚类_46

 

拓端tecdat|r语言有限正态混合模型EM算法的分层聚类、分类和密度估计及可视化_聚类_47

拓端tecdat|r语言有限正态混合模型EM算法的分层聚类、分类和密度估计及可视化_r语言_48

  1.   
  2.  summary(boot4, what = "se")
  3.   
  4.  plot(boot4)
  5.  

拓端tecdat|r语言有限正态混合模型EM算法的分层聚类、分类和密度估计及可视化_d3_49

拓端tecdat|r语言有限正态混合模型EM算法的分层聚类、分类和密度估计及可视化_r语言_50

降维

聚类

  1.  
  2.   
  3.  plot(mod1dr, "pairs")
  4.  

拓端tecdat|r语言有限正态混合模型EM算法的分层聚类、分类和密度估计及可视化_r语言_51

拓端tecdat|r语言有限正态混合模型EM算法的分层聚类、分类和密度估计及可视化_r语言_52

plot(mod1dr)

拓端tecdat|r语言有限正态混合模型EM算法的分层聚类、分类和密度估计及可视化_r语言_53

plot(mod1dr, "scatterplot")

拓端tecdat|r语言有限正态混合模型EM算法的分层聚类、分类和密度估计及可视化_聚类_54

拓端tecdat|r语言有限正态混合模型EM算法的分层聚类、分类和密度估计及可视化_聚类_55

plot(mod1dr)

拓端tecdat|r语言有限正态混合模型EM算法的分层聚类、分类和密度估计及可视化_聚类_56

分类

  1.  
  2.   
  3.  summary(mod2dr)
  4.   
  5.  plot(mod2d)
  6.  

拓端tecdat|r语言有限正态混合模型EM算法的分层聚类、分类和密度估计及可视化_聚类_57

拓端tecdat|r语言有限正态混合模型EM算法的分层聚类、分类和密度估计及可视化_r语言_58

  1.  plot(mod2dr)
  2.   

拓端tecdat|r语言有限正态混合模型EM算法的分层聚类、分类和密度估计及可视化_聚类_59

  1.  
  2.   
  3.  summary(mod3dr)
  4.   
  5.  plot(mod3dr)
  6.  

拓端tecdat|r语言有限正态混合模型EM算法的分层聚类、分类和密度估计及可视化_d3_60

拓端tecdat|r语言有限正态混合模型EM算法的分层聚类、分类和密度估计及可视化_d3_61

  1.  plot(mod3dr)
  2.   
  3.   
  4.  

拓端tecdat|r语言有限正态混合模型EM算法的分层聚类、分类和密度估计及可视化_聚类_62

使用调色板

大多数图形都使用默认的颜色。

调色板可以定义并分配给上述选项,具体如下。

  1.  options("Colors" = Palette )
  2.  Pairs(iris[,-5], Species)
  3.   
  4.  

拓端tecdat|r语言有限正态混合模型EM算法的分层聚类、分类和密度估计及可视化_d3_63

拓端tecdat|r语言有限正态混合模型EM算法的分层聚类、分类和密度估计及可视化_r语言_64

如果需要,用户可以很容易地定义自己的调色板。

参考文献

Fraley C. and Raftery A. E. (2002) Model-based clustering, discriminant analysis and density estimation, Journal of the American Statistical Association, 97/458, pp. 611-631.


拓端tecdat|r语言有限正态混合模型EM算法的分层聚类、分类和密度估计及可视化_d3_65

 

特别声明:以上内容(图片及文字)均为互联网收集或者用户上传发布,本站仅提供信息存储服务!如有侵权或有涉及法律问题请联系我们。
举报
评论区(0)
按点赞数排序
用户头像
精选文章
thumb 中国研究员首次曝光美国国安局顶级后门—“方程式组织”
thumb 俄乌线上战争,网络攻击弥漫着数字硝烟
thumb 从网络安全角度了解俄罗斯入侵乌克兰的相关事件时间线