微软开源了一个高效的推理框架:bitnet.cpp,可直接在 CPU 上运行 1-bit 模型推理(如 BitNet b1.58) 2025/04/30 mmexport1746013697921.mp4