Needle — 26M 参数工具调用模型Github从 Gemini 蒸馏的超小型工具调用模型访问网站https://github.com/cactus-compute/needle访问网站https://github.com/cactus-compute/needleNeedle 是 Cactus Compute 开源的 26M 参数模型,从 Gemini 蒸馏而来,专注于单次函数/工具调用。在边缘设备上跑出 6000 tok/s 预填充速度,适合手机、手表、眼镜等受限设备上的 AI 助手场景。HN 775 分,GitHub 2400+ stars。