MoE | Geek Terminal

【衝撃】10年前のGTX 1080が最新30B MoEで24 tok/sを記録！？富豪ハードへの「最適化」という名の反逆

📝 本日のニュース概要 2026年、ローカルLLM界隈に激震が走っています。かつての名機、8GB VRAMのGTX 1080が、最新の30BクラスMoEモデルを24 tokens per secondという実用速度で回したという報告が相次い...

2026.05.15

ローカルLLM

📝 本日のニュース概要 2026年4月19日、ローカルLLM界隈を震撼させた「--n-cpu-moe」フラグの発見。VRAM容量を超えた巨大なMoEモデルを動作させる魔法の杖でしたが、そこには「プロンプト処理（Prefill）が地獄のように...

2026.05.13

ローカルLLM

📝 本日のニュース概要 AI界に激震。家庭用GPUで動作する27BのDense（高密度）モデルが、その14倍以上の規模を誇る397B MoEモデルをコーディング性能で上回るという「異常事態」が発生しました。LocalLLaMAコミュニティで...

2026.04.24

ローカルLLM

📝 本日のニュース概要 2026年4月19日、ローカルLLM界隈に激震。Qwen3.6-35B-A3Bという巨大なMoE（Mixture of Experts）モデルを、ミドルレンジGPUであるRTX 5070 Tiで「爆速」駆動させる禁断...

2026.04.19

ローカルLLM

📝 本日のニュース概要 2026年4月、Qwenチームから最新モデル「Qwen3.6-35B-A3B」が突如リリースされました。総パラメータ35Bに対し、アクティブパラメータをわずか3Bに抑えたMoE（Mixture of Experts）...

2026.04.18

ローカルLLM

📝 本日のニュース概要 Googleが放った最新オープンモデル「Gemma 4」。4月13日の放送ではその圧倒的なベンチマーク性能をお伝えしましたが、現場のユーザーからは「モデルが怠惰（Lazy）だ」という不満と、「いや、これこそが効率化の...

2026.04.14

ローカルLLM