学術研究 【衝撃】NVIDIAが放つ「Tri-mode推論」がヤバすぎる!1回の計算で6トークン並列生成、Qwen3ベースで推論の物理的限界を突破か? 📝 本日のニュース概要 以前お伝えしたTPS(Tokens Per Second)向上議論に、とんでもない続報が入ってきました。NVIDIA AIが、投機的デコーディングに頼らず「モデル単体で1フォワード6トークン」を生成する新アーキテクチ... 2026.05.21 学術研究