休闲区 稀宇科技发布并开源新一代 MiniMax 01 系列模型,参数量达 4560 亿 该系列模型首次大规模实现线性注意力机制,打破 Transformer 传统架构记忆瓶颈,能够处理 400 万 token 的输入,可输入长度是 GPT-4o 的 32 倍,Claude-3.5-Sonnet 的 20 倍。 0 14 0 Share