【面试向】如何进行多标签分类

Q：多标签分类怎么解决？

解决多标签分类问题的方法有很多，个人感觉只有两种比较好用。

第一种是将n标签问题转化为n个二分类的问题，即模型输出为长度为n的二值向量，每个值对应一个标签，用于表示样本是否包含该标签。这应该是最简单常见的方法，但该方法忽略了标签与标签之间的相关性。

第二种是使用CNN+RNN+Embedding的策略（参考文献：CNN-RNN: A Unified Framework for Multi-label Image Classification）。该方法考虑到了各个标签之间的关联性，将每个标签映射到高维空间上。每次运行预测一个标签，并根据该标签预测下一个标签。理论上该方法的准确率会比较高，但时间效率很低。

Kaggle: iMet Collection 2019 - FGVC6 大都会文物分类竞赛就是多标签分类任务，几乎所有参赛者都使用第一种方法。