ai 45

从 8B 到 8GB：LLM 参数量与权重空间的心算法 2026/07/31
Agent 与 AI 搜索服务：能力边界与评测方法 2026/07/30
从输入表示到文本生成：Transformer 三类架构与多模态 Token 2026/07/27
Multica 自托管：它是什么，如何部署与运行 2026/07/24
本地大模型推理入门：推理引擎生态、GGUF 量化与镜像加速下载 2026/07/24
女娲与本竹 Skill 结构分析：人物蒸馏、证据检索与去语料化改造 2026/07/14
2026 年 7 月 AI/LLM 趋势图表解读 2026/07/11
OpenAI、Anthropic 与国产旗舰模型 API 价格对比 2026/07/10
工作区优先的 Agent Harness 设计 2026/07/06
树莓派 AI 是怎么回事：从 Hailo NPU 到本地 LLM 的能力边界 2026/07/02
把搜索当代码来写：AI Agent 的搜索范式重构 2026/06/26
大模型公司的收入幻觉：产品收入还是项目收入？ 2026/06/23
SAG：用 SQL 动态激活超边的检索增强生成 2026/06/23
Loop Engineering：从 prompt 到 loop 的瓶颈迁移 2026/06/14
Transformer 推理系列（四）：QwQ-32B 部署显存与低精度计算 2026/06/14
AI Coding CLI 为什么全面倒向 TypeScript 2026/06/13
GraphRAG vs LightRAG：从传统 RAG 的痛点到图增强检索的选型权衡 2026/06/13
RAG 的工程深度：切分、检索、排序、评估与幻觉防护 2026/06/13
Transformer 推理系列（三）：从 PagedAttention 到 Prefix Caching 2026/06/13
Transformer 推理系列（二）：从 Prefill 到 Decode 2026/06/13
Softmax：把分数变成概率分布 2026/06/13
Transformer 推理系列（一）：从 Attention 到 KV Cache 2026/06/12
为 Jekyll 博客搭建 Docker 开发环境：从跨平台问题到多阶段构建优化 2026/06/11
Claude 的 200K 是 token 不是 KB 2026/06/08
LSP 能力演示与原理解析：Claude Code + jdtls 实战 2026/06/08
【Anthropic】Claude Code 中的 Skills：从内部实践中汲取的经验 2026/06/08
【Anthropic】Claude Code 在大型代码库中的工作原理：Harness 架构与部署模式 2026/06/07
Kimi Agent 集群模式实战：无线 Mesh 方案调研完整执行记录（超详细版） 2026/06/06
Kimi Agent 集群模式实战：无线 Mesh 方案调研完整执行记录 2026/06/06
【Anthropic】Claude Code 自动模式：在自主性与安全间的平衡 2026/06/05
【Anthropic】Context Engineering 框架：从原则到工具维度实践 2026/06/05
【Anthropic】Claude 代理工具高级特性：工具搜索、编程调用、使用示例 2026/06/05
【Anthropic】构建长期自主 Agent 的三重挑战与解法 2026/06/05
【Anthropic】长期自主编程的 Harness 架构设计 2026/06/05
【Anthropic】长期运行 Agent 的有效容器架构 2026/06/05
【Anthropic】AI Agent 的上下文工程：让有限的 token 更高效 2026/06/05
Harness Engineering：AI Agent 从能跑到跑稳的第三道关 2026/06/04
Claude Code 多 Agent 机制：隔离、通信与并发的源码解析 2026/05/28
Claude Code 源码里的 Harness Engineering 2026/05/27
Claude Code /powerup 教程速览 2026/05/27
grep vs RAG：Claude Code 检索之争 2026/05/27
Claude Context：给 Claude Code 加向量检索 2026/05/27
Claude Code 为什么用 grep 而不是 RAG 2026/05/27
LLM工作原理 2025/07/29
Manus 2025/05/24