
SmolLM
高效小型语言模型
- 支持多种参数规模:135M、360M和1.7B参数。
- 在高质量数据集上进行训练,提供高性能。
- 适用于本地设备,减少推理成本,提高隐私保护。
- 在多种基准测试中表现优异,测试常识推理和世界知识。
- 支持多种硬件配置,从智能手机到笔记本电脑。
- 提供ONNX和WebGPU演示,易于部署和使用。
- 支持指令调优,使用公开许可的指令数据集进行训练。
产品详情
SmolLM是一系列最新的小型语言模型,包含135M、360M和1.7B参数的版本。这些模型在精心策划的高质量训练语料库上进行训练,能够实现在本地设备上运行,显著降低推理成本并提高用户隐私。SmolLM模型在多种基准测试中表现优异,测试了常识推理和世界知识。