【面试向】如何进行多标签分类

Q:多标签分类怎么解决?

解决多标签分类问题的方法有很多,个人感觉只有两种比较好用。

第一种是将n标签问题转化为n个二分类的问题,即模型输出为长度为n的二值向量,每个值对应一个标签,用于表示样本是否包含该标签。这应该是最简单常见的方法,但该方法忽略了标签与标签之间的相关性。

第二种是使用CNN+RNN+Embedding的策略(参考文献:CNN-RNN: A Unified Framework for Multi-label Image Classification)。该方法考虑到了各个标签之间的关联性,将每个标签映射到高维空间上。每次运行预测一个标签,并根据该标签预测下一个标签。理论上该方法的准确率会比较高,但时间效率很低。

image.png

Kaggle: iMet Collection 2019 - FGVC6 大都会文物分类竞赛就是多标签分类任务,几乎所有参赛者都使用第一种方法。

-------------本文结束感谢您的阅读-------------