卷起来了呀,MiniMax也玩起了开源周,哈哈哈哈,这是对标DeepSeek开源周的节奏呀! 先***地期待一手,不知道后面四天都会有什么内容,不过,现在大模型厂真的卷到飞起了! Day1,MiniMax 是先开源了混合注意力推理模型-M1,这个模型是在今年1月份开源的MiniMax-Text-01模型上增量训练得来的,结构跟MiniMax-Text-01模型一致,MoE结构,总参数456B,激活参数45.9B。
Paper:***s://github***/MiniMax-AI/MiniMax-M1/blob/main/…。
{dede:pagebreak/}
国密加密算法有多安全呢?
为什么网络上都在说隋坡厉害?
巴基斯坦援助伊朗防空,大家怎么看?
如何客观评价李小冉的长相?
二手主机市场里的。处理器为英特尔e5 12核24线程的机特别多,为何?
为什么官方详细通报了“罗某宇坠楼***”,还有很多人不信?
如何看待苹果在 WWDC25 发布的 Foundation 模型框架,它将为开发者和用户带来哪些改变?
如何自己搭建家庭服务器?
家里想搞个服务器,有什么好的建议方案吗?
DF-41已经可以打击美国本土,这是否相当于古巴导弹危机常态化?
你的鱼缸里养过什么奇怪的鱼?
大家猜猜伊朗的结局如何?
如何看待伊朗国家电视台发文:“今晚,将会发生一件大事,让世界铭记几个世纪。”?
伊朗是个怎么样的国家?
Golang vs Rust vs Dlang 哪个更有前途,哪位大牛这 3 门语言都用过?
以色列摩萨德这么厉害,中国网民为何不害怕?