您的位置:首页 > 财经 > 产业 > 25届科大讯飞飞星计划 AI研究算法工程师 面经

25届科大讯飞飞星计划 AI研究算法工程师 面经

2025/1/9 1:56:40 来源:https://blog.csdn.net/raelum/article/details/141260838  浏览:    关键词:25届科大讯飞飞星计划 AI研究算法工程师 面经

目录

  • 一面/技术面 2024/08/15

📋 总结: 本来应该是在7月底面试的,但因为有事就拖到了现在,或许是飞星计划里最晚面试的一批?面试官很和蔼,问的问题不算难,总体体验还算不错。

一面/技术面 2024/08/15

  1. 深挖实习
  2. 深挖论文(论文的创新点?训练时模型和数据的规模?你在论文中的贡献?)
  3. LLM预训练数据通常是由哪些部分组成的?
  4. 你都了解过哪些预训练数据集?分别介绍一下
  5. 预训练数据的SOP是怎样的?请从零开始讲,包括采集,解析,质量过滤,敏感内容过滤,去重等
  6. 怎样对网页数据进行解析?有没有遇到过棘手的问题?又是如何解决的?
  7. 怎样对PDF文档进行过滤?
  8. 表格数据应当如何清洗?
  9. Python中列表和生成器的区别?
  10. 怎样快速统计一个文本文件中有多少行等于abc?
  11. 形状为(1,2,3)和(3,2,1)的张量进行相加,会发生什么?得到的结果是什么样的?
  12. 介绍一下Adam优化器的原理。
  13. 一个6B的模型保存到计算机中会占用多少空间?
  14. 训练途中保存一个checkpoint和直接训完保存的模型有什么区别?(当时没太听懂问题)
  15. LLM的词表是如何构建的?LLaMA如何做词表扩充?
  16. LLM为什么会出现复读机的现象?又该如何解决?
  17. 手撕代码:无(我也不知道为什么没有算法题,或许是因为专项计划?)

一面问题总体来说不算难,等二面面过后继续更新

版权声明:

本网仅为发布的内容提供存储空间,不对发表、转载的内容提供任何形式的保证。凡本网注明“来源:XXX网络”的作品,均转载自其它媒体,著作权归作者所有,商业转载请联系作者获得授权,非商业转载请注明出处。

我们尊重并感谢每一位作者,均已注明文章来源和作者。如因作品内容、版权或其它问题,请及时与我们联系,联系邮箱:809451989@qq.com,投稿邮箱:809451989@qq.com