DeepSeek推出NSA机制提升长上下文训练与推理效率

时间：2025年02月18日 16:52

比特之家 2月18日消息，DeepSeek宣布推出NSA（稀疏注意力机制），该机制与硬件高度一致且支持本机训练，旨在实现超快速的长上下文训练和推理。通过针对现代硬件的优化设计，NSA在加速推理速度的同时显著降低预训练成本，且不会影响模型性能。据官方介绍，NSA在通用基准测试、长上下文任务以及基于指令的推理中表现优异，与完全注意力模型相比表现相当甚至更佳。

本分分类： 快讯

以太坊Beam Chain更新：8个新团队加入，由于“Beam”涉及商标问题计划更名

QCP Asia：以太坊期权市场出现波动，Pectra升级成关键驱动因素

币种	价格	涨跌幅
BTC 比特币	$95620	-0.65%
ETH 以太坊	$2688.96	-1.07%
XRP 瑞波币	$2.58	-3.75%
USDT 泰达币	$0.999774	-0.02%
BNB 币安币	$650.12	-3.12%
SOL Solana	$168.18	-8.9%
USDC USDC	$0.999893	-0.01%
DOGE 狗狗币	$0.251701	-4.42%
ADA 艾达币	$0.781331	-1.71%
STETH Lido Staked Ether	$2684.13	-1.14%
TRX 波场	$0.239347	-2.85%
WBTC Wrapped Bitcoin	$95490	-0.66%
LINK Chainlink	$18.14	-5.31%
WSTETH Wrapped stETH	$3191.74	-1.64%
XLM 恒星币	$0.32538	-4.23%

DeepSeek推出NSA机制提升长上下文训练与推理效率

币安APP

OKX欧易app