原计划是基于BERT或者GPT做一些自然语言处理的应用研究,deepseek出来之后,决定使用deepseek来做,相信能够获得更好的效果。
1、deepseek的论文
deepseek的论文《DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning》于2025年1月下旬同步发布在了github和arxiv上。
github地址:https://github.com/deepseek-ai/DeepSeek-R1
arxiv地址:https://arxiv.org/abs/2501.12948
2、deepseek的版本及开源情况
根据论文摘要,deepseek总共开源了deepseek-R1-Zero、DeepSeek-R1,以及6个基于Qwen和LLaMA从DeepSeek-R1中知识蒸馏得到的小模型。
这些模型在HuggingFace上的下载地址
deepseek-ai (DeepSeek)