您的位置：首页 > 财经 > 金融 > 上海广告传媒有限公司_工业设计相关网站_torrentkitty磁力官网_360优化大师官方版

上海广告传媒有限公司_工业设计相关网站_torrentkitty磁力官网_360优化大师官方版

2025/7/2 8:52:11 来源：https://blog.csdn.net/paixiaoxin/article/details/144892369 浏览: 次关键词：上海广告传媒有限公司_工业设计相关网站_torrentkitty磁力官网_360优化大师官方版

上海广告传媒有限公司_工业设计相关网站_torrentkitty磁力官网_360优化大师官方版

论文标题：

Link-Context Learning for Multimodal LLMs

面向多模态大型语言模型的链接上下文学习

论文链接：

Link-Context Learning for Multimodal LLMs论文下载

论文作者：

Yan Tai, Weichen Fan, Zhao Zhang, Feng Zhu, Rui Zhao, Ziwei Liu

内容简介：

这篇论文提出了一种新的学习方法——链式上下文学习（Link-Context Learning, LCL），旨在增强多模态大型语言模型（MLLMs）在对话中理解和应用新概念的能力。通过强调“从因果关系中推理”，LCL超越了传统的上下文学习（In-Context Learning, ICL），通过加强支持集和查询集之间的因果关系，使MLLMs能够更有效地识别未见图像和理解新概念。为了评估这一新方法，作者引入了ISEKAI数据集，该数据集包含专门设计的未见生成图像-标签对，用于链式上下文学习。广泛的实验表明，LCL-MLLM在新概念的链式上下文学习能力上优于传统的MLLMs。

关键点：

1.链式上下文学习（LCL）：

引入了一种新的少样本学习设置，要求MLLMs在对话中吸收新概念，并保留这些知识以准确回答问题。
LCL通过在支持集和查询集之间建立因果链接，增强了模型对源和目标之间因果关系的理解。

2.ISEKAI数据集：

为了评估MLLMs在LCL中的表现，作者发布了ISEKAI数据集，包含未见图像和全新概念。
数据集的图像由Stable Diffusion和Midjourney生成，标签或概念是虚构的，以确保MLLMs完全未见。

3.实验结果：

通过在ISEKAI数据集上的实验，展示了LCL方法的有效性，与现有的MLLMs相比，LCL-MLLM在处理完全未知图像的场景中表现出色。
在ImageNet-100数据集上的实验也证实了LCL方法的有效性，该数据集包含100个训练阶段未见过的类别。

4.训练策略：

论文提出了不同的训练策略，包括[2-way]、[2-way-random]、[2-way-weight]和[mix]策略，以提升模型在不同情况下的表现。
[mix]策略通过结合[2-way]任务和Shikra的原始任务，提升了模型的泛化能力。

CV-MLLM必读论文合集：

CV-MMLM必读论文合集

希望这些论文能帮到你！如果觉得有用，记得点赞关注哦~ 后续还会更新更多论文合集！！

代码链接：

论文中提到，代码和数据将在以下链接发布：https://github.com/isekai-portal/Link-Context-Learning。

版权声明:

本网仅为发布的内容提供存储空间，不对发表、转载的内容提供任何形式的保证。凡本网注明“来源：XXX网络”的作品，均转载自其它媒体，著作权归作者所有，商业转载请联系作者获得授权，非商业转载请注明出处。

我们尊重并感谢每一位作者，均已注明文章来源和作者。如因作品内容、版权或其它问题，请及时与我们联系，联系邮箱：809451989@qq.com，投稿邮箱：809451989@qq.com

最新新闻

热搜词

软考之进制转换编译Arm Qt5.14.2 VUE项目npm报错：reason: certificate has expired Linux中常用的文件管理命令 Java创建对象和spring创建对象的过程和区别 Springboot3+Vue3实现文件上传下载功能

声明：本站所有新闻及新闻图片来源于其他网站，如有侵权，请及时联系我们！

客户服务 | 关于我们 | 版权声明

版权所有：

Copyright 2024 尧图网 All Rights Reserved.QQ:809451989