Llama 3.1:开源语言模型的新里程碑

大家好,最近AI领域的新闻接踵而至,让人目不暇接。就在7月(23号)晚上,Meta发布了Llama 3.1系列模型,包括8B、70B参数的版本,以及此前提到过的400B参数模型(实际上是405B)。根据Meta官方公布的数据,Llama 3.1 405B参数模型在某些测试数据集上甚至略微胜过了GPT-4。今天,让我们一起来了解Llama 3.1的更新内容,以及如何免费使用这个令人期待的模型。


Llama 3.1的主要更新

  1. Context Window扩展:Llama 3.1将模型的Context Window从原来的8K tokens扩展到了128K tokens,极大地提升了处理长文和长对话的能力。

  2. 模型架构:Llama 3.1沿用了Llama 3的基础架构,即使是405B参数的模型也采用标准的decoder-only transformer架构,而非混合专家模型。同时继续使用GQA(分组查询注意力)技术,提高了长文处理能力。

  3. 性能表现

    • Llama 3.1 405B模型在多个测试数据集上超越了GPT-4o和Claude 3.5 Sonnet等顶级商业闭源模型。
    • 8B参数版本优于参数相近的Gemma 2 9B IT和Mistral 7B Instruct。
    • 70B参数版本不仅胜过开源模型Mixtral 8x22B,还在多项测试中大幅领先GPT-3.5 Turbo。
  4. 许可证更新:Meta更新了Llama 3.1的许可条款,允许使用模型输出来改进其他语言模型,但要求训练出的新模型名称必须以"Llama"开头,并标注"Built with Llama"。

  5. 指令微调:Llama 3.1的Instruct版本根据工具调用进行了微调,并引入了新的iPython角色来接收和记录工具调用返回的数据。

如何免费使用Llama 3.1


  1. HuggingChat

    • 提供Llama 3.1 405B和70B参数模型的免费使用。
    • 用户友好的对话界面,支持对话历史记录和工具调用选择。
    • 访问地址:https://huggingface.co/chat/icon-default.png?t=N7T8https://huggingface.co/chat/
  2. Groq

    • 使用自研LPU进行推理,注册简单(仅需Google账号)。
    • 生成速度快,提供免费的OpenAI兼容API。
    • 目前对API调用有每日Token限制。api地址:https://console.groq.com/icon-default.png?t=N7T8https://console.groq.com/
    • groq网址:https://groq.com/icon-default.png?t=N7T8https://www.youtube.com/redirect?event=video_description&redir_token=QUFFLUhqa05JR19rSmF3Wm9fZE50YUktZU9QNWw1aVJOUXxBQ3Jtc0tteWRHOVl2WF9lM0FzS1J2eGtnc2hLQ3k5ZkRUZlFJczRNOWV0NTFsQ013MGFlTktyMTV1bTdqbW1OSFRPbW5zUXo4cTRUb043UUt4TEtXZEJxcml4T0dvbkRKVkFqOXBDMk9hTlpWTmJxWnBXRDFiUQ&q=https%3A%2F%2Fgroq.com%2F&v=4oUG_CRmjGY


推荐使用LM Studio程序:LM Studio - Discover, download, and run local LLMsLM Studio is an easy to use desktop app for experimenting with local and open-source Large Language Models (LLMs). The LM Studio cross platform desktop app allows you to download and run any ggml-compatible model from Hugging Face, and provides a simple yet powerful model configuration and inferencing UI. The app leverages your GPU when possible.icon-default.png?t=N7T8https://lmstudio.ai/

  • 提供便捷的模型下载界面和对话窗口。
  • 使用llama.cpp进行模型推理,适合无独立显卡的设备。
  • 支持不同程度量化的模型版本,如Q4_K_M(推荐),平衡大小和性能。


Llama 3.1的发布无疑是开源语言模型发展的一个重要里程碑。405B参数模型与顶级商业闭源模型的竞争力,以及8B参数模型超越Google Gemma 2 9B的表现,都展示了开源社区的巨大潜力。Meta允许将Llama 3.1用于知识蒸馏,这一决定将进一步推动开源AI社区的蓬勃发展。




