MTP

未分類

【ローカルLLM】QwenMTP完全保存版!785個のMTP完全保持&検閲排除の「35B-A3B Heretic」がローカルLLM界を震撼させる噂を徹底解剖

📝 本日のニュース概要 2026年5月22日、ik_llama.cppの最適化によってQwen3.6 35Bが12GB VRAMで110 tok/sという驚異的な爆速駆動を記録したニュースをお伝えしましたが、今回はその系譜におけるさらなる「...
ローカルLLM

【geek-terminalニュース】旧世代V100で27Bモデルが秒間1000トークン!? 投機デコーディングを極限まで研ぎ澄ました「MTP並列最適化」の変態的ハックがRedditで話題に

📝 本日のニュース概要 2026/05/22にお伝えした「Qwen3.6 35Bが110 tps」という驚異の記録からわずか数日。今度は、骨董品とも言われかねない旧世代のエンタープライズGPU「NVIDIA V100」を使い、27Bクラスの...
ローカルLLM

【衝撃】12GB VRAMで35Bモデルが110 tok/s!?ik_llama.cppが物理限界を突破した「思考の速度」超えベンチマークを徹底解説

📝 本日のニュース概要 2026年5月17日に報じたllama.cppへのMTP統合。その「理論上の爆速」が、ついに実ハードウェアでの検証結果として結実しました。ミドルレンジの代名詞12GB VRAM環境(RTX 3060/4070等)で、...
ローカルLLM

【VRAM 12GBの奇跡】Qwen3.6異端版が80tok/sec到達!19個のMTPを完全保持した変態的最適化の正体

📝 本日のニュース概要 2026年5月8日に第一報をお伝えしたQwen3.6の検閲切除版「heretic v2」が、ついに実用極限のパフォーマンスに到達しました。12GB VRAMという、ミドルレンジGPU(RTX 4070/5060クラス...
ローカルLLM

【衝撃】Qwen3.6 27B検閲解除v2降臨!MTP構造を維持したまま「知性の物理切除」に成功。KLD 0.0021の驚異を徹底解説

📝 本日のニュース概要 2026年5月8日、Local LLM界隈に激震が走りました。昨日お伝えしたQwen3.6へのMTP(複数トークン予測)移植というニュースに続き、本日、検閲を完全に排除しつつMTP構造と知性を極限まで維持した「Qwe...
ローカルLLM

【geek-terminalニュース】Redisの父antirezが放つ、DeepSeek 4 Flash専用「極小・爆速」Metal推論エンジンが革命を起こす

📝 本日のニュース概要 2026年4月26日のDeepSeek-V4衝撃発表からわずか数週間。Redisの生みの親、antirez氏が「既存の重厚なフレームワークを捨て、CとMetalでゼロから書き上げた」DeepSeek 4 Flash専...
ローカルLLM

【衝撃】Qwen3.6がMTPで2.5倍速へ!RTX 3090で262k文脈を維持する「ローカル自律コーディング」の夜明け

📝 本日のニュース概要 Google Gemma 4の専売特許だったMTP(Multi-Token Prediction)が、ギークたちの手によってQwen 3.6へ電撃移植!シングルRTX 3090で256Kコンテキストを回しつつ、コーデ...