MoE

ローカルLLM

【衝撃】10年前のGTX 1080が最新30B MoEで24 tok/sを記録!?富豪ハードへの「最適化」という名の反逆

📝 本日のニュース概要 2026年、ローカルLLM界隈に激震が走っています。かつての名機、8GB VRAMのGTX 1080が、最新の30BクラスMoEモデルを24 tokens per secondという実用速度で回したという報告が相次い...
ローカルLLM

【geek-terminal】MoEオフロードの「呪い」が解けた!Prefill加速で巨大LLM常用時代へ

📝 本日のニュース概要 2026年4月19日、ローカルLLM界隈を震撼させた「--n-cpu-moe」フラグの発見。VRAM容量を超えた巨大なMoEモデルを動作させる魔法の杖でしたが、そこには「プロンプト処理(Prefill)が地獄のように...
ローカルLLM

【下克上】27Bが397Bを粉砕?Qwen 3.6が突きつけた「MoE不要論」の衝撃と知能密度の正体

📝 本日のニュース概要 AI界に激震。家庭用GPUで動作する27BのDense(高密度)モデルが、その14倍以上の規模を誇る397B MoEモデルをコーディング性能で上回るという「異常事態」が発生しました。LocalLLaMAコミュニティで...
ローカルLLM

【Geek Terminal】RTX 5070 Tiで79t/sを叩き出す変態技術!Qwen3.6 MoEの「VRAM不足」を力技で解決する新フラグの衝撃

📝 本日のニュース概要 2026年4月19日、ローカルLLM界隈に激震。Qwen3.6-35B-A3Bという巨大なMoE(Mixture of Experts)モデルを、ミドルレンジGPUであるRTX 5070 Tiで「爆速」駆動させる禁断...
ローカルLLM

【衝撃】Qwen3.6-35B-A3Bがリリース!RTX 4090で「25万トークン」を飲み込むローカルエージェントの怪物を徹底解剖

📝 本日のニュース概要 2026年4月、Qwenチームから最新モデル「Qwen3.6-35B-A3B」が突如リリースされました。総パラメータ35Bに対し、アクティブパラメータをわずか3Bに抑えたMoE(Mixture of Experts)...
ローカルLLM

【Geek Terminal】Gemma 4は「怠惰」なのか?Redditで勃発した26B MoEモデルを巡る熱狂と落胆の全貌

📝 本日のニュース概要 Googleが放った最新オープンモデル「Gemma 4」。4月13日の放送ではその圧倒的なベンチマーク性能をお伝えしましたが、現場のユーザーからは「モデルが怠惰(Lazy)だ」という不満と、「いや、これこそが効率化の...