用 Ollama 在 MacBook Pro 上跑了 Llama 3 8B,速度居然还可以。试了几个 prompt,逻辑推理能力比我想象中强。

下一步想试试用 llama.cpp 自己编译,看看能不能榨出更多性能。或者搞个微调?