微软开源了一个高效的推理框架:bitnet.cpp,可直接在 CPU 上运行 1-bit 模型推理(如 BitNet b1.58)

添加新评论