CerebrasAI开源可以在iPhone上运行的30亿参数大模型:BTLM-3B-8K,免费可商用,支持最高8K上下文输入,仅需3GB显存
大模型的进展非常快,但是如何在移动端部署和使用依然是一个非常大的挑战。今天,CerebrasAI联合Opentensor一起开源了一个30亿参数规模的模型BTLM-3B-8K,官方宣称其性能接近70亿参数规模的大模型,但是运行的资源却很低,最低量化版本只需要不到4GB显存即可。

BTLM-3B-8K模型简介
BTLM全称Bittensor Language Model,是由CerebrasAI与Opentensor共同研发的一个大语言模型。
该模型只有30亿参数的规模,但是在多项评测结果中,其性能接近70亿参数规模的主流模型。该模型在还未发布的一个AI超级计算机上训练。该模型架构接近此前CerebrasGPT模型(参考:https://www.datalearner.com/ai-models/pretrained-models/Cerebras-GPT )。
BTLM-3B-8K基于SlimPajama-627B数据集训练(参考:https://www.datalearner.com/blog/1051686496562817 ),该数据集含6270亿个tokens,质量很高,做了广泛去重。





