您的位置：首页 > 新闻 > 会展 > 资料导览（持续更新）

资料导览（持续更新）

2025/4/19 9:31:20 来源：https://blog.csdn.net/Janexjy/article/details/140069036 浏览: 次关键词：资料导览（持续更新）

经典推荐

多模态大模型：基础架构
图解DSPy：Prompt的时代终结者？！
vLLM, LMDeploy, MLC-LLM, TensorRT-LLM, and TGI的性能小实验
优雅谈大模型13：一文读懂LoRA/DoRA/MoRA
新鲜速递：图解新颖LLM的CoPE位置编码

专栏导航

综合性的调查报告打开是最合适的。
平时闲暇无事，订阅一份最新动态也是不错。
若理解大模型，想进一步的学习大模型，可以订阅大模型必备腔调。
若已经具备一定的基础，想系统性的学习大模型背后的基础原理，可以订阅LLM背后的基础模型
若已经是半个玩家，则可以订阅最新科技，亦或者订阅论文精读
若是侧重关心部署运维，则订阅AI架构设计专栏是不错的选择。
若对多模态或者具身智能感兴趣，可以订阅具身智能

主流架构索引

Mamba
Mamba-2
xLSTM
KAN
TransFormer
ViT

酸甜苦辣的模型们

Claude3.5：编码螃蟹游戏就是这么轻松
Gemma 2

Phi-3 Mini
“最好的开放模型”，LLAMA3重磅来袭
GPT-4o: 从最难的“大海捞针”基准看起
SleepFM：利用对比学习预训练的多模态“睡眠”基础模型
Codestral横空出世：高级还是资深程序员
TimesFM: 预训练的时间序列基础模型
TSLANet：时间序列模型的新构思

多模态与具身智能

Llama 3-V: 比GPT4-V小100倍的SOTA
Cephalo：专门用于仿生设计的多模态视觉大型语言模型
Chameleon：早期融合混合模态的基础模型
4M-21：霸气侧漏高效的20+多模态AI模型
Octo精武门：开源的通用机器人模型

大模型的小配件

一文读懂OpenGVLab带来的最新视觉预训练框架
EAGLE系列，大模型的“草稿技术”
稀疏编码，直视大模型的灵魂深处
大模型的灵魂解读：Anthropic AI的Claude3 Sonnet可解释性研究

轻松读懂FlashAttention-1
轻松读懂FlashAttention-2
轻松读懂FlashAttention2

Vidur: 出手只需1小时，瞬间节省20万美元
“开放”的大模型到底有多“开放”？！

沉睡而且“狡猾”的特工：大模型也可以是！

新鲜速递：图解新颖LLM的CoPE位置编码
MIT提出基于Transformer的Cross-Layer Attention：江湖骗子还是奇思妙想

RAG专区

奇思妙想：多头RAG

大模型语料（数据治理）

论文精读：构建金融商业交易语料库
论文精读：基于BERT的医学影像报告语料库构建
论文精读：利用大型语言模型从儿科患者病历中提取社会决定因素：新型语料库与方法
速递FineWeb：一个拥有无限潜力的15T Tokens的开源数据集

版权声明:

本网仅为发布的内容提供存储空间，不对发表、转载的内容提供任何形式的保证。凡本网注明“来源：XXX网络”的作品，均转载自其它媒体，著作权归作者所有，商业转载请联系作者获得授权，非商业转载请注明出处。

我们尊重并感谢每一位作者，均已注明文章来源和作者。如因作品内容、版权或其它问题，请及时与我们联系，联系邮箱：809451989@qq.com，投稿邮箱：809451989@qq.com

最新新闻

热搜词

Qt5.14.2下载如何建设运维告警体系，保障SLA的5个9 1.2 基于卷积神经网络与SE注意力的轴承故障诊断 AI日报 - 2025年4月2日 Linux shell command lsof All In One VMware 1067启动NATservice失败

声明：本站所有新闻及新闻图片来源于其他网站，如有侵权，请及时联系我们！

客户服务 | 关于我们 | 版权声明

版权所有：

Copyright 2024 尧图网 All Rights Reserved.QQ:809451989