LocalLLM

【ローカルLLM】QwenMTP完全保存版！785個のMTP完全保持＆検閲排除の「35B-A3B Heretic」がローカルLLM界を震撼させる噂を徹底解剖

📝 本日のニュース概要 2026年5月22日、ik_llama.cppの最適化によってQwen3.6 35Bが12GB VRAMで110 tok/sという驚異的な爆速駆動を記録したニュースをお伝えしましたが、今回はその系譜におけるさらなる「...

2026.05.27

未分類

📝 本日のニュース概要 2026年5月20日、アリババが「Qwen 3.7-Max」を正式発表。100万トークンの巨大コンテキスト窓と、推論特化型エージェント機能を統合した「真の怪物」の登場にLocalLLaMA界隈が揺れています。以前お伝...

2026.05.23

ローカルLLM

📝 本日のニュース概要 2026年5月17日に報じたllama.cppへのMTP統合。その「理論上の爆速」が、ついに実ハードウェアでの検証結果として結実しました。ミドルレンジの代名詞12GB VRAM環境（RTX 3060/4070等）で、...

2026.05.22

ローカルLLM

📝 本日のニュース概要巨大LLMの時代は終わったのか？わずか4B（40億）パラメータの軽量モデルを使用しながら、コーディングベンチマークで87%という驚異的なスコアを叩き出したエージェント「SmallCode」がRedditで大炎上中。モ...

2026.05.19

プログラミング

📝 本日のニュース概要 2026年5月、ローカルLLM界隈を震撼させている「検閲解除（Abliteration）」の真偽。以前お伝えしたHeretic公開以降、乱立するアンセンサードモデルに対し、有志が85GPU時間を投じて「重みレベルの鑑...

2026.05.18

ローカルLLM

📝 本日のニュース概要 2026年、ローカルLLM界隈に激震が走っています。かつての名機、8GB VRAMのGTX 1080が、最新の30BクラスMoEモデルを24 tokens per secondという実用速度で回したという報告が相次い...

2026.05.15

ローカルLLM

📝 本日のニュース概要ついに、我々ローカルLLM愛好家が待ち望んだ「最終兵器」が姿を現しました。台湾Skymizerが発表したPCIe推論カード『HTX301』。その最大の特徴は、NVIDIAがコンシューマー向けGPUに課してきた「VRA...

2026.05.09

ハードウェア＆インフラ

📝 本日のニュース概要 2026年5月8日、Local LLM界隈に激震が走りました。昨日お伝えしたQwen3.6へのMTP（複数トークン予測）移植というニュースに続き、本日、検閲を完全に排除しつつMTP構造と知性を極限まで維持した「Qwe...

2026.05.08

ローカルLLM

📝 本日のニュース概要 Google Gemma 4の専売特許だったMTP（Multi-Token Prediction）が、ギークたちの手によってQwen 3.6へ電撃移植！シングルRTX 3090で256Kコンテキストを回しつつ、コーデ...

2026.05.07

ローカルLLM

📝 本日のニュース概要 2026年5月2日、Local LLM界隈に激震。4月に登場した推論加速技術「DFlash」の正統進化、あるいは対となる新技術「PFlash」の噂がReddit（r/LocalLLaMA）を中心に急浮上しています。1...

2026.05.02

ローカルLLM