每天给你送来NLP技术干货!
干货
作者:炼丹小生来自:炼丹笔记
如何通过融合解决多标签分类(MLC)问题.这里给了两个的方案:
SST
与大多数机器学习模型一样,这里的目标是构造一个将输入映射到输出的函数,在这种情况下,输出将是一组向量.单一目标(ST)考虑m个单一模型来预测多标签。此外,还引入了stack的方式(SST)提高效果。SST有两个预测阶段。在第一阶段,用m个模型预测m个目标。在后一阶段,通过变换训练集D,为每个目标学习一组m'元模型。在变换后的训练集中,它使用输出空间的估计值。
ERC
这里需要注意的是,训练的时候我们依赖的是真实标签Y1,...,Ym-1,因为我们已经有了真实值,但对于预测,ERC必须依赖于估计值。但作为ML中的一个假设,输入和输出变量应该是独立的。为了解决这个问题,在训练中拆除了一部分样本用于训练,并对估计值进行了k-折叠交叉验证,并将其用于训练部分,代码见参考资料。
参考资料
- Multi-target regression via input space expansion: treating targets as inputs
- Binary relevance efficacy for multilabel classification. Progress in Artificial Intelligence
- Classifier chains for multi-label classification. Machine Learning
- https://github.com/samanemami/ERC/blob/main/Examples/training_erc.py
下载一:中文版!学习TensorFlow、PyTorch、机器学习、深度学习和数据结构五件套! 后台回复【五件套】
下载二:南大模式识别PPT 后台回复【南大模式识别】
投稿或交流学习,备注:昵称-学校(公司)-方向,进入DL&NLP交流群。
方向有很多:机器学习、深度学习,python,情感分析、意见挖掘、句法分析、机器翻译、人机对话、知识图谱、语音识别等。
记得备注呦
代码语言:javascript复制整理不易,还望给个在看!