Page 1 of 1

什么是少镜头学习?用有限的数据获取信息

Posted: Sun Jan 12, 2025 8:37 am
by Habib01
分享
不断发展的数据科学领域依靠数据而蓬勃发展,但获取大型标记数据集可能是模型开发过程中的主要瓶颈。这就是从少数示例中学习的用武之地,它提供了一种革命性的方法,使我们能够从少数示例中提取有价值的信息。

与需要大量数据的传统监督学习方法不同,低数据学习使模型能够快速学习和适应,使其在数据稀缺、收集成本昂贵或性质脆弱的领域高度相关。

本文对小样本学习进行了全面的探索,深入探讨了它的重要性、机制以及在各个领域的各种应用。

什么是少镜头学习?
少样本学习 (FSL) 是机器学习的一个子领域,其中模型学 亚马逊数据 习识别模式并根据极少量的训练样本进行预测。这与传统的监督学习形成鲜明对比,传统的监督学习通常需要大量标记数据才能进行有效的训练。

LSF 更强调泛化而不是记忆。第一批作品之一是Tom B. Brown 等人的《语言模型是很少的学习者》 ,其中质疑详尽调整的必要性。

该图对比了监督学习和少样本学习,前者需要大量标记数据,后者使用小型支持集和相似性函数对查询集中的企鹅、鹈鹕和海雀等示例进行分类。

图表说明了监督学习和小样本学习方法之间的差异。监督学习部分演示了如何使用大量标记数据来训练特征提取器模型,而少数示例学习部分演示了如何使用一小组支持示例和相似性函数来对一组查询进行预测。资料来源:Paperspace

想象一下一个孩子正在学习识别不同的动物。只需举几个狗、猫和鸟的例子,他们将来就能够快速识别和区分这些生物,即使他们遇到以前从未见过的品种或物种。

这种从有限数据中进行概括的能力是人类智能的一个显着特征,也正是从少量数据中学习的目的。

关键是能够辨别定义类别的基本结构和特征。

人类具有从有限的经验中提取重要信息并将这些知识应用于新情况的天生能力。低数据学习模型试图通过从以前的经验中学习对数据底层结构的一般理解来模拟这一点。