SmolLM

SmolLM

高效小型语言模型

  • 支持多种参数规模:135M、360M和1.7B参数。
  • 在高质量数据集上进行训练,提供高性能。
  • 适用于本地设备,减少推理成本,提高隐私保护。
  • 在多种基准测试中表现优异,测试常识推理和世界知识。
  • 支持多种硬件配置,从智能手机到笔记本电脑。
  • 提供ONNX和WebGPU演示,易于部署和使用。
  • 支持指令调优,使用公开许可的指令数据集进行训练。

产品详情

SmolLM是一系列最新的小型语言模型,包含135M、360M和1.7B参数的版本。这些模型在精心策划的高质量训练语料库上进行训练,能够实现在本地设备上运行,显著降低推理成本并提高用户隐私。SmolLM模型在多种基准测试中表现优异,测试了常识推理和世界知识。