OpenBMB是什么
OpenBMB是由清华大学自然语言处理实验室和面壁智能共同支持发起的一个开源社区,OpenBMB全称为Open Lab for Big Model Base,旨在打造大规模预训练语言模型库与相关工具, 加速百亿级以上大模型的训练、微调与推理,降低大模型使用门槛。OpenBMB致力于与国内外开发者共同努力形成大模型开源社区, 推动大模型生态发展,实现大模型的标准化、普及化和实用化,让大模型飞入千家万户。

OpenBMB发起团队拥有深厚的自然语言处理和预训练模型研究基础,近年来围绕模型预训练、提示微调、模型压缩技术等方面在顶级国际会议上发表了数十篇高水平论文。
OpenBMB官网:https://openbmb.cn/
OpenBMB平台能力

OpenBMB 平台 BM 体系架构图
BMTrain
大模型训练“发动机”。BMTrain进行高效的大模型预训练与微调。与DeepSpeed等框架相比,BMTrain训练模型成本可节省90%。
BMCook
大模型“瘦身”工具库。BMCook进行大模型高效压缩,提高运行效率。通过量化、剪枝、蒸馏、专家化等算法组合,可保持原模型90%+效果,模型推理加速10倍。
BMInf
千元级显卡玩转大模型推理。BMInf实现大模型低成本高效推理计算,使用单块千元级显卡(GTX 1060)即可进行百亿参数大模型推理。
OpenPrompt
大模型提示学习利器。OpenPrompt提供统一接口的提示学习模板语言, 它的组合性和模块化可以让你轻松部署提示学习方法以驱动大模型。
OpenDelta
“小”参数撬动“大”模型。OpenDelta进行参数高效的大模型微调,仅更新极少参数(小于5%)即可达到全参数微调的效果。
ModelCenter
大模型仓库。ModelCenter基于BMTrain工具实现了一系列预训练语言模型,支持高效、低成本、可扩展性强的模型微调及分布式训练。
OpenBMB官网:https://openbmb.cn/