上周刚刚发布,仅在HuggingFace上就已超400万次下载量 这使得Gemma 4 12B成为迄今为止最受欢迎的免编码器VLM。
上周刚刚发布,仅在HuggingFace上就已超400万次下载量 这使得Gemma 4 12B成为迄今为止最受欢迎的免编码器VLM。 此外,它还是第一款支持免编码器音频输入的通用LLM!
所有带有「产品更新」标签的 AI 情报。
5 条情报上周刚刚发布,仅在HuggingFace上就已超400万次下载量 这使得Gemma 4 12B成为迄今为止最受欢迎的免编码器VLM。 此外,它还是第一款支持免编码器音频输入的通用LLM!
NVIDIA刚刚发布了0.6B参数的语音识别模型 名为Nemotron-3.5-ASR 支持40多种语言,实时流式输出——无需GPU,纯CPU即可运行 速度是官方Nemo运行时的2.5倍,识别结果完全一致 可以
认识一下 DiffusionGemma! 一个实验性的开源模型,探索文本生成的快速新方法,采用 Apache 2.0 许可发布。 超越逐 token 的顺序生成过程,同时生成整块文本。以下是 DiffusionGemma 的新特性:
一个人打开了《神鬼寓言 5》的发行页面,发现了每个人都会记住的部分 不是基准图表。 的例子。 > 仅使用屏幕截图就击败了神奇宝贝 > 自主玩异星工厂 >并且Stripe在50M行代码迁移上使用了它 这就是区别
v0.109.1