纯净系统之家 - 专注分享最好用的电脑系统

当前位置: 纯净系统之家 >  微软资讯 >  AMD首款“小语言模型”Llama-135m发布,具备推测解码能力

AMD首款“小语言模型”Llama-135m发布,具备推测解码能力

更新时间:2024-09-30 10:21:52作者:kzmyhome
9月30日消息,据报道。AMD 近日在 Huggingface 平台发布了其首款“小语言模型”——AMD-Llama-135m。该模型基于 Apache 2.0 开源许可,拥有 6700 亿个 token,并具备推测解码功能。

AMD首款“小语言模型”Llama-135m发布,具备推测解码能力

据报道。推测解码的核心原理是通过小型草稿模型生成候选token,再由较大的目标模型进行验证。此过程在性能不受影响的前提下,每次前向传递可以生成多个token。减少内存(RAM)占用,并提高处理效率。

AMD透露,AMD-Llama-135m在四个AMD Instinct MI250节点上训练了六天,此外还推出了“编程专用版本”——变体AMD-Llama-135m-code,该版本经过额外四天的微调训练,以适应编程任务。

Copyright ©  2012-2024 纯净系统之家 版权声明 网站地图