作者认为在 FGVC 中,不仅 “细粒度” 的定义受专业知识影响,图像的质量也会影响标签的粒度,例如分辨率较低的图像往往会被分配更粗粒度的标签,这增加了构造单一粒度分类数据集的难度。因此,受到专业知识和图像分辨率的影响,样本可能在任意标签层级上被观察到,例如,一张低分辨率的信天翁图像可能只会被标上粗粒度标签 [“Albatross”] 而非细粒度标签 [“Albatross”, “Laysan Albatross”]。因此,在传统的层次多粒度分类问题中,样本都具有完整的从粗粒度到细粒度的多个层次标签,而作者要解决的问题是样本可能在任意标签层级上被观察到的层次多粒度分类问题 (samples are labeled at any level of the hierarchy),这样就可以有效利用那些只包含粗粒度标签的样本