LLM | ページ 3 | Geek Terminal

【衝撃】AIが「回路」になった。Karpathy MicroGPTをFPGA化、毎秒5万トークンの異次元推論がGPUを嘲笑う

📝 本日のニュース概要ついに「AIの物理化」が臨界点を超えました。Andrej Karpathy氏が提唱した最小構成のLLM『MicroGPT』を、PythonやCUDAといったソフトウェア層を一切介さず、FPGA（現場書き換え可能ゲート...

2026.05.04

ハードウェア＆インフラ

📝 本日のニュース概要 2026年5月2日、Local LLM界隈に激震。4月に登場した推論加速技術「DFlash」の正統進化、あるいは対となる新技術「PFlash」の噂がReddit（r/LocalLLaMA）を中心に急浮上しています。1...

2026.05.02

ローカルLLM

📝 本日のニュース概要 2026年5月2日、LocalLLaMAコミュニティを揺るがしているのは、もはや単一PCの限界突破ではありません。4/28に紹介した『継ぎ木GPU』の斜め上を行く、16ノードもの物理環境をSparkでクラスタリングす...

2026.05.02

ハードウェア＆インフラ

📝 本日のニュース概要 2026年、AI推論は「人間が読める言葉」の呪縛から解き放たれようとしています。MicrosoftやNVIDIA、そして研究コミュニティで激論が交わされている「ベクトル空間での直接推論（Latent Reasonin...

2026.04.30

学術研究

📝 本日のニュース概要 2026年の現代、AIは常に最新データを追い求めています。しかし、あえて「1931年以前」の知識のみを学習させ、100年前の価値観と知能を完全にシミュレートしようという変態的なプロジェクト『Talkie-1930』が...

2026.04.29

学術研究

📝 本日のニュース概要 2026年、世界を席巻した「AIエージェント」ブームに冷や水が浴びせられています。以前お伝えした「フレームワーク批判（04/21）」や「知能の腐敗問題（04/29）」の決定打として、今、現場の実装者たちから「そもそも...

2026.04.29

ロボティクス＆エージェント

📝 本日のニュース概要 AMD GPUユーザー待望の救世主か、それとも狂気の産物か。GitHubで突如注目を集めたAMD RDNA専用推論エンジン『Hipfire』を徹底解剖。ROCmのオーバーヘッドを嫌い、GPU演算器を直接叩くRust実...

2026.04.28

ハードウェア＆インフラ

📝 本日のニュース概要 2026年、RAG（検索拡張生成）のパラダイムが根底から覆されようとしています。これまで「RAG＝ベクトル検索」という図式が当たり前でしたが、Vectify AIが公開した「PageIndex」は、高コストなベクトル...

2026.04.27

プログラミング

📝 本日のニュース概要 AI界の効率モンスター、DeepSeekが最新モデル『DeepSeek-V4』を発表しました。特筆すべきは、100万トークン（1M context）という超長文を、従来の10%のKVキャッシュで実現した「Compre...

2026.04.26

ローカルLLM

📝 本日のニュース概要 2026年4月15日に議論した「AIエージェントの信頼性」問題が、最悪の形で現実となりました。ビジネスシーンの「行儀の良い」プロンプトでは決して露呈しなかった自律型エージェントの論理的脆弱性が、システムの隙を突く天才...

2026.04.26

セキュリティ＆脆弱性