全文链接:http://tecdat.cn/?p=30605
原文出处:拓端数据部落公众号
应用关联规则、聚类方法等数据挖掘技术分析治疗抑郁症的中药专利复方组方配伍规律。方法检索治疗抑郁症中药专利复方,排除外用中药及中西药物合用的复方。最近我们被要求撰写关于用药规律的研究报告,包括一些图形和统计输出。对入选的中药专利复方进行术语规范化等处理,抽取信息、建立表,应用数据分析软件R对数据进行关联规则分析,应用网络分析软件进行聚类分析。
查看数据
转换成二值矩阵数据
代码语言:javascript复制colnames(data) <- paste0("X",1:ncol(data))
for(i in 1:nrow(data)) {
tmp <- integer(length(total_types))
建立apriori
代码语言:javascript复制plot(all_rules, method = "graph")
中药专利复方中药对的关联规则分析
药对是方剂配伍的基本形式,它反映了中药之间相辅相成、相反相成、同类相从等配伍关系。药对中的中药在组方配伍时具有在处方中同时出现的特点,因此在关联规则分析中,分析置信度较大且双向关联的规则即可得到药对。
根据置信度和支持度筛选强关联规则
K-means均值网络聚类分析
抑郁症中药专利复方中药物之间形成了一个复杂的配伍关系网络,关联规则分析可以用来发现其中的药对及强关联规则,但随着支持度和置信度阈值参数的降低,关联规则大量涌现,使得其中的配伍规律变得难以分析,应用网络聚类方法可以有效地发现其中的配伍规律。
代码语言:javascript复制#聚类类别号
kmod$cluster
查看每个类别中的强关联规则
聚类1
聚类2
配伍关系网络的聚类分析结果显示了抑郁症治疗中常用的中药“社团”,反映了复方中一些配伍关系相对密切、固定的中药联合,临床运用可以提高疗效。
最受欢迎的见解
1.R语言分布式滞后非线性模型(DLNM)空气污染研究温度对死亡率影响建模
2.R语言分布滞后线性和非线性模型(DLNM)分析空气污染(臭氧)、温度对死亡率时间序列数据
3.R语言群组变量选择、组惩罚GROUP LASSO套索模型预测分析新生儿出生体重风险因素数据和交叉验证、可视化
4.R语言逻辑回归、随机森林、SVM支持向量机预测FRAMINGHAM心脏病风险和模型诊断可视化
5.R语言非线性混合效应 NLME模型(固定效应&随机效应)对抗哮喘药物茶碱动力学研究
6.R语言使用限制平均生存时间RMST比较两条生存曲线分析肝硬化患者
7.分类回归决策树交互式修剪和更美观地可视化分析细胞图像分割数据集
8.PYTHON深度学习实现自编码器AUTOENCODER神经网络异常检测心电图ECG时间序列
9.R语言如何在生存分析与Cox回归中计算IDI,NRI指标