MTP | Geek Terminal

【ローカルLLM】QwenMTP完全保存版！785個のMTP完全保持＆検閲排除の「35B-A3B Heretic」がローカルLLM界を震撼させる噂を徹底解剖

📝 本日のニュース概要 2026年5月22日、ik_llama.cppの最適化によってQwen3.6 35Bが12GB VRAMで110 tok/sという驚異的な爆速駆動を記録したニュースをお伝えしましたが、今回はその系譜におけるさらなる「...

2026.05.27

未分類

📝 本日のニュース概要 2026/05/22にお伝えした「Qwen3.6 35Bが110 tps」という驚異の記録からわずか数日。今度は、骨董品とも言われかねない旧世代のエンタープライズGPU「NVIDIA V100」を使い、27Bクラスの...

2026.05.26

ローカルLLM

📝 本日のニュース概要 2026年5月17日に報じたllama.cppへのMTP統合。その「理論上の爆速」が、ついに実ハードウェアでの検証結果として結実しました。ミドルレンジの代名詞12GB VRAM環境（RTX 3060/4070等）で、...

2026.05.22

ローカルLLM

📝 本日のニュース概要 2026年5月8日に第一報をお伝えしたQwen3.6の検閲切除版「heretic v2」が、ついに実用極限のパフォーマンスに到達しました。12GB VRAMという、ミドルレンジGPU（RTX 4070/5060クラス...

2026.05.10

ローカルLLM

📝 本日のニュース概要 2026年5月8日、Local LLM界隈に激震が走りました。昨日お伝えしたQwen3.6へのMTP（複数トークン予測）移植というニュースに続き、本日、検閲を完全に排除しつつMTP構造と知性を極限まで維持した「Qwe...

2026.05.08

ローカルLLM

📝 本日のニュース概要 2026年4月26日のDeepSeek-V4衝撃発表からわずか数週間。Redisの生みの親、antirez氏が「既存の重厚なフレームワークを捨て、CとMetalでゼロから書き上げた」DeepSeek 4 Flash専...

2026.05.08

ローカルLLM

📝 本日のニュース概要 Google Gemma 4の専売特許だったMTP（Multi-Token Prediction）が、ギークたちの手によってQwen 3.6へ電撃移植！シングルRTX 3090で256Kコンテキストを回しつつ、コーデ...

2026.05.07

ローカルLLM