"); //-->
01
背 景
在机器学习领域中,学习不平衡的标注数据一直是一个常见而具有挑战性的任务。近年来,视觉 Transformer 作为一种强大的模型,在多个视觉任务上展现出令人满意的效果。然而,视觉 Transformer 处理长尾分布数据的能力和特性,还有待进一步挖掘。目前,已有的长尾识别模型很少直接利用长尾数据对视觉 Transformer(ViT)进行训练。基于现成的预训练权重进行研究可能会导致不公平的比较结果,因此有必要对视觉 Transformer 在长尾数据下的表现进行系统性的分析和总结。本文旨在填补这一研究空白,详细探讨了视觉 Transformer 在处理长尾数据时的优势和不足之处。本文将重点关注如何有效利用长尾数据来提升视觉 Transformer 的性能,并探索解决数据不平衡问题的新方法。通过本文的研究和总结,研究团队有望为进一步改进视觉 Transformer 模型在长尾数据任务中的表现提供有益的指导和启示。这将为解决现实世界中存在的数据不平衡问题提供新的思路和解决方案。文章通过一系列实验发现,在有监督范式下,视觉 Transformer 在处理不平衡数据时会出现严重的性能衰退,而使用平衡分布的标注数据训练出的视觉 Transformer 呈现出明显的性能优势。相比于卷积网络,这一特点在视觉 Transformer 上体现的更为明显。另一方面,无监督的预训练方法无需标签分布,因此在相同的训练数据量下,视觉 Transformer 可以展现出类似的特征提取和重建能力。基于以上观察和发现,研究提出了一种新的学习不平衡数据的范式,旨在让视觉 Transformer 模型更好地适应长尾数据。通过这种范式的引入,研究团队希望能够充分利用长尾数据的信息,提高视觉 Transformer 模型在处理不平衡标注数据时的性能和泛化能力。
02
文章贡献
其次,本文提出了平衡的二进制交叉熵损失函数,并给出了严格的理论推导。平衡的二进制交叉熵损失的形式如下:
与之前的平衡交叉熵损失相比,本文的损失函数在视觉 Transformer 模型上展现出更好的性能,并且具有更快的收敛速度。研究中的理论推导为损失函数的合理性提供了严密的解释,进一步加强了我们方法的可靠性和有效性。
不同损失函数的收敛速度的比较基于以上贡献,文章提出了一个全新的学习范式 LiVT,充分发挥视觉 Transformer 模型在长尾数据上的学习能力,显著提升模型在多个数据集上的性能。该方案在多个数据集上取得了远好于视觉 Transformer 基线的性能表现。
不同参数量下在 ImageNet-LT 上的准确性。
在 ImagNet-LT(左)和 iNaturalist18(右)数据集上的性能表现同时,本文还验证了在相同的训练数据规模的情况下,使用ImageNet的长尾分布子集(LT)和平衡分布子集(BAL)训练的 ViT-B 模型展现出相近的重建能力。如 LT-Large-1600 列所示,在 ImageNet-LT 数据集中,可以通过更大的模型和 MGP epoch 获得更好的重建结果。
03
总 结
转自《机器之心》
专栏文章内容及配图由作者撰写发布,仅供工程师学习之用,如有侵权或者其他违规问题,请联系本站处理。 联系我们
相关推荐
CSR8670CSR8675智能语音Alexa蓝牙方案开发
英伟达CFO:我们早就知道内存大涨价要来了
海联达(Aigale)Ai-HD1 无线全高清套件拆解
iCAN-4017 AI功能模块
紧凑型集成连接器模块抑制噪声 为人工智能应用实现以太网供电
尼吉康的事业介绍
人工智能是如何帮助阻止造假者的?
基于Ai-WB2-12F与Rd-04的雷达检测系统
瑞萨电子AI单元解决方案成功提高GE医疗(日本)日野工厂的生产力
释说芯语16:硬科技:构建企业未来之路(附PPT)
Nigel AI赋能LabVIEW,NI用AI重塑测试新边界
PowiGaN for AI Data Centers: Unmatched Power Density and Reliability
研华 COMPUTEX 首度整合全球伙伴大会 强化全球边缘 AI 生态系统联结
电子元件培训教材
GPU:面临工作负载转变的高吞吐架构
万家乐JSYZ5-AI燃气热水器电路图
基于Microchip MCU的AI/ML培训教程2
AI 驱动估值飙升:光通信半导体企业市值暴涨
AI热潮引发多层陶瓷电容MLCC供应短缺
基于VisitionX制造智能眼镜
WTC-AI太阳能热水器电路图
AI竞争进入下半场:从“卷参数”到“卷单价”
WTC-AI型太阳能热水器电路图
基于Microchip MCU的AI/ML培训教程3
赋能边缘端对话式人工智能
基于Microchip MCU的AI/ML培训教程1
EEPW2018年6月刊(5G)
继上次海联达Ai-ap100拆机之电源改造
EEPW2018年3月刊(工业物联网)
爱立信携手 Net Feasa 布局海事网络 融合公网级通信与智能体 AI 赋能航运