AI | ページ 2 | Geek Terminal

【衝撃】12GB VRAMで35Bモデルが110 tok/s！？ik_llama.cppが物理限界を突破した「思考の速度」超えベンチマークを徹底解説

📝 本日のニュース概要 2026年5月17日に報じたllama.cppへのMTP統合。その「理論上の爆速」が、ついに実ハードウェアでの検証結果として結実しました。ミドルレンジの代名詞12GB VRAM環境（RTX 3060/4070等）で、...

2026.05.22

ローカルLLM

📝 本日のニュース概要以前お伝えしたTPS（Tokens Per Second）向上議論に、とんでもない続報が入ってきました。NVIDIA AIが、投機的デコーディングに頼らず「モデル単体で1フォワード6トークン」を生成する新アーキテクチ...

2026.05.21

学術研究

📝 本日のニュース概要 2026年、AI生成コードの「雰囲気（Vibe）」に依存した開発が限界を迎えています。C++の生みの親Bjarne Stroustrup氏がAIコードの未熟さを指摘し、コミュニティでは低品質なAI生成物「Worksl...

2026.05.20

プログラミング

📝 本日のニュース概要 2026年5月20日、AIの歴史に刻まれる構造的革命が起きました。Transformerの宿命であった計算量O(n^2)の壁を突破する「劣二次（Sub-quadratic）」モデルがついに1200万トークンの文脈窓を...

2026.05.20

学術研究

📝 本日のニュース概要巨大LLMの時代は終わったのか？わずか4B（40億）パラメータの軽量モデルを使用しながら、コーディングベンチマークで87%という驚異的なスコアを叩き出したエージェント「SmallCode」がRedditで大炎上中。モ...

2026.05.19

プログラミング

📝 本日のニュース概要 2026年5月18日、ギークコミュニティに激震が走りました。長年「Linuxデスクトップ普及の最大の壁」と言われ続けてきたAdobe製品。これまでWineや仮想環境での不完全な動作に甘んじてきましたが、ついにAIエー...

2026.05.18

プログラミング

📝 本日のニュース概要物理学の聖杯「統一場理論」に、AIのテンソル演算が終止符を打つ！？最新のarXiv論文とギークコミュニティの熱狂から、量子・古典・重力を統合する『内部構造量モデル』の全貌に迫ります。宇宙の最小構造は、実は行列の圧縮プ...

2026.05.18

学術研究

📝 本日のニュース概要 2026年、AIモデルの巨大化とRTX 5090の高騰予想が重なる中、ギークたちの飢餓感はついに「物理的な破壊と再構築」へと至りました。中国のハードウェアハッカー界隈から流出した、RTX 4090のVRAMを24GB...

2026.05.16

ハードウェア＆インフラ

📝 本日のニュース概要 2026年5月10日、世界を震撼させた「BunのAI主導・6日間Rust移行完了」というニュース。しかし、そのわずか数日後、GitHubで衝撃のIssueが報告されました。Miriチェックに悉く失敗し、安全なはずのR...

2026.05.16

プログラミング

📝 本日のニュース概要 2026年、ローカルLLM界隈に激震が走っています。かつての名機、8GB VRAMのGTX 1080が、最新の30BクラスMoEモデルを24 tokens per secondという実用速度で回したという報告が相次い...

2026.05.15

ローカルLLM