高质量交互训练“学生”模型
足够的高质量交互可以训练较弱的“学生”模型模仿有用行为。
所有带有「model」标签的 AI 情报。
24 条情报足够的高质量交互可以训练较弱的“学生”模型模仿有用行为。
编码在上下文和内存方面有显著提升,模型在复杂任务中表现更佳。
现在可以在不重写代码的情况下在TPU和GPU之间切换,支持原生PyTorch。
BraceSproul 和 jakebroekhuizen 分享关于开源模型的见解。
认识一下 DiffusionGemma! 一个实验性的开源模型,探索文本生成的快速新方法,采用 Apache 2.0 许可发布。 超越逐 token 的顺序生成过程,同时生成整块文本。以下是 DiffusionGemma 的新特性:
哇,我可能刚在Model 3上体验了史上最长的特斯拉真正智能召唤。我的车自己开了0.4英里,连续2分40秒没有停过一次。太牛了!
Highly anticipated Mythos (released as Fable 5) model just dropped! By far the most expensive model I’ve seen so far, let’s see if it lives up to the hype. Fable 5 pricing: - $10/m Input tokens - $50/m Output tokens Comp
这是我们Mac-1模型的预告:66亿参数模型,可在任何Mac上本地运行,需要7GB内存(12GB更佳)。支持487个MacOS原生工具、多工具链式任务、推理已开启、输出约65 tok/s。我们在模型周围构建了强大的应用层。
NVIDIA的Nemotron 3 Ultra是最便宜的高性能长上下文模型,完全开放。
动态前缀缓存通过重新定位动态上下文块来节省模型成本。
很快,竞赛数学将不再有趣,期待明年推出完美模型。
新课程探讨如何以低延迟和合理成本服务多个用户。课程由@RedHat和@cedricclyburn共同开发。
在数据不足的情况下,如何将多轮预训练扩展到数百轮?
今天我们发布了Nemotron 3 Ultra,具备550B MoE前沿智能模型。
Reve 2.0支持原生4K输出,具备类似PS的编辑能力,用户可直接选择图像的各个部分。
静态基准测试逐渐失效,评估和训练数据应与前沿模型共同演进。
研究令牌优化和模型路由,提出应对推理成本和需求的优化方法。
Meta在基础设施、人才和下一代模型上进行大量投资,竞逐个人AI的未来。
介绍由@EvansXuHan领导的StereoPolicy项目,旨在增强机器人政策模型的几何线索。
我们为GPT-Rosalind引入新功能,旨在支持生命科学研究。
新论文探讨了更大模型的优势,分析了数据资源竞争的影响。
新发布的Gemma 4 12B模型可以在笔记本电脑上本地运行,支持强大的多步骤推理和代理工作流。
这个模型在更广泛的应用中至关重要,感谢大家的支持。
每个人都在构建代理或工具,但你真正需要的是一个反应器,我正在开发一个有趣的项目。