llama.cpp

【衝撃】Qwen3.6-35B-A3Bがリリース！RTX 4090で「25万トークン」を飲み込むローカルエージェントの怪物を徹底解剖

📝 本日のニュース概要 2026年4月、Qwenチームから最新モデル「Qwen3.6-35B-A3B」が突如リリースされました。総パラメータ35Bに対し、アクティブパラメータをわずか3Bに抑えたMoE（Mixture of Experts）...

2026.04.18

ローカルLLM

📝 本日のニュース概要 2026年4月、ローカルLLM界に激震が走りました。PrismMLが発表した「Ternary Bonsai」は、実質1.125ビットという驚異的な量子化を実現した新しいLLMファミリーです。80億パラメータのモデルが...

2026.04.18

ローカルLLM

📝 本日のニュース概要 2026年4月、ローカルLLM界隈はRTX 50シリーズ（Blackwell）のネイティブ4bit演算「NVFP4」の実装で沸騰しています。Gemma 4 26BをvLLMやllama.cppで動かした際の圧倒的なス...

2026.04.18

ハードウェア＆インフラ

📝 本日のニュース概要 2026年4月、Local LLM界隈に激震。llama.cppに導入された新フラグ『--ai-tune』は、実行環境に合わせてAI自らが推論設定を自動最適化し、Qwen3.5-27Bで54%もの速度向上を叩き出しま...

2026.04.16

ローカルLLM