DeepSeek-V2-Chat-0628

DeepSeek-V2-Chat-0628

一款先进的对话生成模型

  • 在 LMSYS Chatbot Arena Leaderboard 上整体排名第11,编程任务排名第3,挑战性提示排名第3。
  • 在多个评估指标上表现出色,如 HumanEval、MATH、BBH、IFEval 和 Arena-Hard。
  • 优化了“系统”领域的指令遵循能力,提升了用户体验。
  • 支持本地运行,需要 80GB*8 的 GPU。
  • 可以通过 Huggingface 的 Transformers 进行模型推理。
  • 推荐使用 vLLM 进行模型推理,提供更高的效率和灵活性。
  • 支持商业用途,适用于需要高效对话生成的企业和开发者。

产品详情

DeepSeek-V2-Chat-0628 是 DeepSeek-V2 系列的改进版本,专为对话生成任务设计。它在 LMSYS Chatbot Arena Leaderboard 上表现出色,整体排名第11,特别是在编程任务和挑战性提示中表现出色。该模型在多个评估指标上均有显著提升,如 HumanEval、MATH、BBH、IFEval 和 Arena-Hard 等。此外,其在“系统”领域的指令遵循能力也经过优化,显著提升了用户体验。