Thinkgap 信息流

过滤噪音，保留 AI 信号。

页面仅读取已加工的 items 表，并以中英双语呈现。

10 条内容

MEDIUM LARGE LANGUAGE MODELS2026年6月14日

LLM中的上下文窗口：AI的工作记忆

这篇简短的教程定义了大型语言模型中的上下文窗口。文章解释上下文窗口是AI模型在生成响应之前可以一次读取和使用的信息量，旨在为初学者介绍这一关键概念。

MEDIUM LARGE LANGUAGE MODELS2026年6月13日

提供的文章正文仅有一句引子，完整内容在Medium继续阅读提示后无法获取。原始内容中未包含任何关于键值缓存、具体模型或推理优化的实质信息。

MEDIUM LARGE LANGUAGE MODELS2026年6月13日

作者测量了一个AI智能体在浏览相似网页时，20轮对话中每一轮的输入令牌成本。第一轮约消耗300个令牌，到第20轮消耗7000个令牌，成本增长约20倍，原因是智能体重复读取之前的所有上下文。这一发现揭示了多轮智能体工作流中隐藏的“上下文税”，推高了推理成本。

MEDIUM LARGE LANGUAGE MODELS2026年6月12日

文章针对云端AI编程工具的速率限制、隐私和网络依赖等问题，介绍如何在Mac上无需GPU，通过Ollama运行Qwen模型，并与VS Code集成，搭建一个本地AI编程助手。教程提供详细的设置步骤，实现离线的私密代码辅助。

MEDIUM LARGE LANGUAGE MODELS2026年6月11日

这篇由Khansa Khanam撰写的Medium文章标榜为本地大语言模型推理的初学者指南。预览内容仅提问'推理究竟意味着什么？'，并提示读者在Medium上继续阅读。现有片段未提供任何具体事实、工具、模型或方法的描述。

MEDIUM LARGE LANGUAGE MODELS2026年6月10日

Michael Yang撰写的Medium文章没有详细内容，仅将读者引导至外部报告auriko.ai/reports/llm-cost-arbitrage。原始内容中未包含成本节省的量化分析、技术方法或实验结果。唯一的信息是标题中提到的缓存感知推理路由。因此，该文章本身未传达任何实质性发现。