“我们又聚在一起了,我们又在一起做事情。”
2025年2月14日至15日,“AI前瞻:超越大语言模型暨2025青源学术年会”在北京首钢园举行。来自全国以及北美、中东、新加坡等海外地区的40余名青年学者齐聚一堂,围绕人工智能的前沿发展展开深入探讨,畅谈青年研究者的成长心得并未来展望。
青源会是由智源研究院支持成立的学术组织,于2020年6月正式创立。它致力于为全球从事智能科学及相关领域的青年学者打造一个专注创新的交流与协作平台。秉持“发现关键问题、搭建合作网络”的使命,青源会始终聚焦青年学者的成长。青源会采用邀请制,经过五年发展,目前已拥有近200名正式会员和1700余名预备会员。
智源与青源会
为青年学者开辟创新“净土”
智源研究院创始理事长张宏江博士指出,青源会的成立初衷是为青年学者在纷繁复杂的学术环境中开辟一片“净土”,让他们能够自由交流、深度思考,专注于人工智能领域的关键问题,并通过合作产出具有突破性的成果。他强调,青年学者是创新的源头,是推动学术进步的核心力量。因此,我们必须更好地呵护这些创新的火种,为青年学者提供坚实的学术支持,助力他们坚守学术理想,勇攀科学高峰,从而产出更多具有世界影响力的研究成果。
智源研究院理事长黄铁军教授在讲话中强调,智源社区和青源会是AI生态的核心平台,所起作用是实实在在的 —— 及时投入资源开展协同创新研发,促进有价值的成果诞生、实现优秀人才的培养和优秀企业的孵化。他强调,智源对生态建设的投入是“施肥”而非“投资”,旨在为创新提供肥沃的土壤,而非追求短期回报。智源将为创新项目提供更自由、灵活的条件,支持青年学者探索各种可能性,推动有价值的创新落地。
智源研究院院长王仲远在2024年回顾与展望中指出,过去一年智源在多个领域取得突破:BGE模型成为HuggingFace平台下载量最高的模型;同时推出EMU多模态大模型,为多模态融合提供新方向;在具身智能领域开启“一横一纵”布局,推动智能技术迈向物理世界;在生物计算方向,开展OpenComplex、智能线虫等重要项目。未来,智源期望和青年学者们一起,在具有影响力且能科研落地的工作上持续发力。
科研速递
激发协作新可能
搭建人工智能领域青年学者交流与协作的平台是青源会一直以来的坚持。本次年会上,40余位学者从深度学习到系统框架,从大脑智能到医学图像分析,从AI for Science到具身智能,进行了一一分享。每位学者都带着扎实的积累与热忱,坦诚交流、互通有无,碰撞出创新的火花。这种跨细分领域的对话不仅拓宽了视野,更为青源会成员们激发协作灵感,合作打下基础。
围炉夜话
关注青年学者成长
关注青年学者成长是青源会的核心立足点。
在当前人工智能领域,青年学者面临职称晋升、学术成果发表和科研项目申请等多重压力,尤其是刚入职的“青椒们”。为助力他们成长,本次年会特别设置了“围炉夜话”环节,邀请学术界和工业界的前辈分享科研与职业发展的经验。大家围绕青年学者的常见困惑,提供实用建议,鼓励他们保持热情、勇于探索,并强调跨学科合作的重要性。
“针对如何解决科研资源不足的问题”,智源创始理事长张宏江博士谈到,做研究要聚焦、有情怀、耐得住寂寞,不能只是为了拿资源或发文章。选题时要相信自己所选的方向是有意义的,能够长期坚持。即使有资源,也要避免因外界诱惑而分散注意力。成功的关键在于聚焦和坚持。
“如何创新性评价青年教师的科研产出和贡献”是当前优化学术管理体系的关键问题。智源研究院理事长黄铁军认为,真正的科研成果应该有长期的生命力,能够在科技发展史上留下痕迹,而不是仅仅参考量化的指标。谈及跨界交叉研究的可行性,他认为,只要AI相关都可以尝试,并没有范围约束,但哪些值得长期投入,仍需动态观察。
时间分配是青年教师们普遍关心的问题。在智源研究院院长王仲远看来,关于时间分配,每个人的精力都不同,职业生涯的经验也没有统一的标准答案。他建议遵循内心的选择,将自己最喜欢做的事情作为职业,这样才能做出成绩。同时他类比《哪吒2》,呼吁大家怀揣信念和情怀,争取制造时代“热款”。
分组研讨
求真务实找出科研「真问题」
在人工智能领域,找到前瞻性的好问题、发掘学科发展难题并探索解决方案,是推动技术突破与创新的关键,也是学者间协同合作的基础。在分组讨论环节,青源会成员们分成5 个小组,分别围绕各子领域的关键问题与挑战、潜在解决方案和资源支持展开研讨。
来自上海交通大学的穆尧作为具身智能组的代表进行汇报,他指出需要扩大真实机器人数据的规模,通过低成本设备进行大规模数据采集,提升真实机器人数据和仿真数据的互补性,需要打破数据壁垒,建立具身数据联盟,设计合理的激励机制,促进数据共享。此外,还需要持续的产业转化和具体商业场景支持,确保高质量数据的持续生成。
来自中国人民大学的朱余韬作为基础模型组的代表进行汇报,他指出需要围绕“现有基础模型架构(如Transformer)是否能统一多模态数据”、“未来是否有新的架构创新”、“现有的自回归训练方法是否适合多模态数据”、“是否有新的训练方法”等问题进一步展开研究。此类研究需要大量算力支持,设计新的数据形式,标注大量数据,支撑探索新的训练方法和模型架构。
来自清华大学的兰艳艳作为AI4Science组的代表展示了讨论结果,她指出需要思考 AI for Science 的真问题是什么,如何定义对科学有价值的问题,如何让AI在科学领域产生突破,体现AI的价值。她呼吁,在AI for Science领域,要同时解决学科建设问题和宏观体系问题。
来自浙江大学的张圣宇作为应用组的代表展示了讨论结果,他认为“AI应用”方面的研究应该从问题出发自顶向下的构建系统化解决方案,而非从工具出发解决碎片化零散问题。同时应关注AI应用的“最后一公里”问题,DeepSeek R1 Zero通过纯强化学习提升低监督数据资源下的推理能力(如中文写作推理),秉承开源开放的AI初心,是DeepSeek被广泛关注和应用的重要原因。
智源研究院的门春雷作为系统组的代表展示了讨论结果,他指出应该思考如何在大规模数据量下,提高向量数据库的可扩展性和精度。此外,还应研究如何高效匹配算法和智算架构,解决智算中心的滞后性问题。该领域人才十分稀缺,需要加强系统软件人才的培养。
智源研究院理事长黄铁军对每一组报告进行了反馈和回应。年会的最后,黄铁军与青源会成员们回顾了智源研究院见证并深度参与中国大模型发展的历程。他呼吁大家充分利用现有资源,将创新想法转化为实际行动。展望2025年,智源期待与更多青年科学家携手,延续“年轻人才挑大梁”的传统,向着AI发展的最前沿攻坚克难,产出更多具有里程碑意义的成果。
- 推荐阅读 -
详解DeepSeek-V3:大模型训练加速神器,MoE焕发新生丨智源深度
报告下载丨重磅!2025十大AI技术趋势
本文版权归智源社区所有