AI

ローカルLLM

【衝撃】12GB VRAMで35Bモデルが110 tok/s!?ik_llama.cppが物理限界を突破した「思考の速度」超えベンチマークを徹底解説

📝 本日のニュース概要 2026年5月17日に報じたllama.cppへのMTP統合。その「理論上の爆速」が、ついに実ハードウェアでの検証結果として結実しました。ミドルレンジの代名詞12GB VRAM環境(RTX 3060/4070等)で、...
学術研究

【衝撃】NVIDIAが放つ「Tri-mode推論」がヤバすぎる!1回の計算で6トークン並列生成、Qwen3ベースで推論の物理的限界を突破か?

📝 本日のニュース概要 以前お伝えしたTPS(Tokens Per Second)向上議論に、とんでもない続報が入ってきました。NVIDIA AIが、投機的デコーディングに頼らず「モデル単体で1フォワード6トークン」を生成する新アーキテクチ...
プログラミング

【geek-terminalニュース】AIコードは「ゴミ(Slop)」か?Bjarne Stroustrupの警告とWorkslop排除運動の最前線

📝 本日のニュース概要 2026年、AI生成コードの「雰囲気(Vibe)」に依存した開発が限界を迎えています。C++の生みの親Bjarne Stroustrup氏がAIコードの未熟さを指摘し、コミュニティでは低品質なAI生成物「Worksl...
学術研究

【衝撃】1200万トークンを52倍速で処理!Transformerを殺す「SubQアーキテクチャ」がAIの歴史を塗り替える

📝 本日のニュース概要 2026年5月20日、AIの歴史に刻まれる構造的革命が起きました。Transformerの宿命であった計算量O(n^2)の壁を突破する「劣二次(Sub-quadratic)」モデルがついに1200万トークンの文脈窓を...
プログラミング

【衝撃】4BモデルがGPT-5超え!? コーディングエージェント「SmallCode」の知能密度がヤバすぎる

📝 本日のニュース概要 巨大LLMの時代は終わったのか?わずか4B(40億)パラメータの軽量モデルを使用しながら、コーディングベンチマークで87%という驚異的なスコアを叩き出したエージェント「SmallCode」がRedditで大炎上中。モ...
プログラミング

【悲願達成?】AIがAdobeの壁を破壊。LightroomをLinuxで「動くまで直した」力学的移植の衝撃

📝 本日のニュース概要 2026年5月18日、ギークコミュニティに激震が走りました。長年「Linuxデスクトップ普及の最大の壁」と言われ続けてきたAdobe製品。これまでWineや仮想環境での不完全な動作に甘んじてきましたが、ついにAIエー...
学術研究

【衝撃】宇宙はテンソルだった?AI技術が解き明かす「物理学統合モデル」の正体

📝 本日のニュース概要 物理学の聖杯「統一場理論」に、AIのテンソル演算が終止符を打つ!?最新のarXiv論文とギークコミュニティの熱狂から、量子・古典・重力を統合する『内部構造量モデル』の全貌に迫ります。宇宙の最小構造は、実は行列の圧縮プ...
ハードウェア&インフラ

【geek-terminalニュース】RTX 4090 48GB物理改造!NVIDIAの制限をねじ伏せる魔改造の正体

📝 本日のニュース概要 2026年、AIモデルの巨大化とRTX 5090の高騰予想が重なる中、ギークたちの飢餓感はついに「物理的な破壊と再構築」へと至りました。中国のハードウェアハッカー界隈から流出した、RTX 4090のVRAMを24GB...
プログラミング

【衝撃】BunのRust移行は「砂上の楼閣」だった?AI生成コードが量産した未定義動作の地獄を深掘り

📝 本日のニュース概要 2026年5月10日、世界を震撼させた「BunのAI主導・6日間Rust移行完了」というニュース。しかし、そのわずか数日後、GitHubで衝撃のIssueが報告されました。Miriチェックに悉く失敗し、安全なはずのR...
ローカルLLM

【衝撃】10年前のGTX 1080が最新30B MoEで24 tok/sを記録!?富豪ハードへの「最適化」という名の反逆

📝 本日のニュース概要 2026年、ローカルLLM界隈に激震が走っています。かつての名機、8GB VRAMのGTX 1080が、最新の30BクラスMoEモデルを24 tokens per secondという実用速度で回したという報告が相次い...