🚀 ggml 通过 SIMD 优化将 WASM 速度提升 2 倍:llama.cpp 的一项最新 pull request 通过利用 SIMD 指令进行点积运算,显著提高了 WebAssembly (WASM) 的性能,实现了 2 倍的速度提升。大部分代码由 DeekSeek-R1 开发,PR 作者专注于测试和提示工程。DeepSeek R1 还展示了强大的代码生成能力,成功重写了 llm_groq.py 插件,并建议取消硬编码的模型映射,转而采用基于 API 响应的动态方法。

(HackerNews)

via 茶馆 - Telegram Channel
 
 
Back to Top