Infogap 信息流

过滤噪音，保留 AI 信号。

页面仅读取已加工的 items 表，并以中英双语呈现。

219

第 2 / 37 页

筛选

社交来源: V2EX2026年6月14日重要度: 2/5

AI 中转服务商 Krill 于 2026 年 6 月 15 日至 18 日推出 618 促销，Codex 基础倍率最低降至 0.15，Codex 套餐可用 66 折优惠码；10 人拼团后实际费率低至 0.1 元/刀。6 月 15 日持有有效 Codex 套餐的老用户额度将直接补足至 0.1 倍率水平。Claude 模型仅通过余额充值提供折扣，无套餐。服务使用 Pro 账号池，强调成本透明。

教程来源: TOWARDSDATASCIENCE2026年6月14日重要度: 3/5

这篇文章系统性地探讨了在 Kubernetes 上运行并发 LLM Agent 时，GPU 时间切片带来的隐藏微观架构成本。文章量化了共同调度 Agentic AI 工作负载的额外开销，并阐释了对运行效率的影响。

开源项目来源: GITHUB2026年6月14日重要度: 2/5

llama.cpp 的 b9631 版本修复了一个命令行界面 Bug，该 Bug 导致保留的令牌（preserved tokens）未能正确复制（对应问题 #24258）。该版本同时提供了针对 macOS（Apple Silicon 和 Intel）、Linux（x64、arm64、s390x、Vulkan、ROCm、OpenVINO、SYCL）、Android（arm64）、Windows（CPU、CUDA、Vulkan、SYCL、HIP）以及 openEuler 等多个平台的预编译二进制文件。此次发布是一次常规修补更新，主要聚焦于一个 CLI 修复。

开源项目来源: GITHUB2026年6月14日重要度: 2/5

本次 llama.cpp 发布将 cohere2moe 分词器添加到 llama-vocab 中，从而支持 TINY_AYA 模型的推理。该变动通过 PR #24601 贡献，同时提供了面向 macOS、Linux、Windows 和 Android 多个计算后端的构建产物。

开源项目来源: GITHUB2026年6月14日重要度: 2/5

llama.cpp 的 b9628 版本将 SYCL 后端的验证纳入持续集成和发布测试流程。新增的 check-release 工作流现覆盖 Ubuntu x64 上的 SYCL FP32 与 FP16 构建以及 Windows x64 上的 SYCL，确保英特尔 GPU 加速获得定期测试。该版本同时保留了针对 macOS、Linux（CPU、Vulkan、ROCm、OpenVINO）、Android 及 Windows（CUDA、Vulkan、HIP）的现有测试矩阵。

教程来源: MEDIUM LARGE LANGUAGE MODELS2026年6月14日重要度: 1/5

提供的文章正文仅有一句引子，完整内容在Medium继续阅读提示后无法获取。原始内容中未包含任何关于键值缓存、具体模型或推理优化的实质信息。