Thinkgap 信息流

过滤噪音，保留 AI 信号。

页面仅读取已加工的 items 表，并以中英双语呈现。

11 条内容

MARKTECHPOST2026年6月16日重点

Qwen-RobotSuite 发布三款具身 AI 模型：面向 VLA 操作、视频世界建模和导航

Qwen 团队发布了 Qwen-RobotSuite，包含三款独立的具身 AI 基础模型。Qwen-RobotManip 基于 Qwen3.5-4B 构建，是一个视觉-语言-动作模型，可将异构操作数据对齐到统一的 80 维动作向量，在 RoboChallenge Table30-v1 上排名第一，并展现出强大的跨具身迁移能力。Qwen-RobotWorld 是一个语言条件的视频世界模型，采用 60 层双流 MMDiT 和冻结的 Qwen2.5-VL 编码器，在 EWMBench 和 DreamGen Bench 上均获总体第一。Qwen-RobotNav 是基于 Qwen3-VL 的可扩展导航模型，具有参数化观察接口，在 VLN-CE RxR 上达到 76.5% 成功率，并支持智能体规划。RobotManip 和 RobotNav 已在 GitHub 开源；RobotWorld 以论文形式发布。

MARKTECHPOST2026年6月14日

FineWeb动手编码教程：流式处理、过滤、去重、分词与大规模网页语料分析

本教程流式处理了FineWeb sample-10BT的3,000篇文档，无需下载完整的多TB语料。复现了Gopher、C4及自定义质量过滤器，由于数据已预过滤，大部分文档通过检测。使用128个哈希排列和0.7阈值的MinHash去重仅发现极少数近似重复对，证实了每次爬取已去重。通过与存储字段对比验证GPT-2分词数，平均绝对差接近0，高度一致。分析涵盖token分布、语言得分、每字符token数和顶级域名，为大规模语料预处理管线提供了可操作的参考。

MARKTECHPOST2026年6月13日

基于city2graph、OSMnx和PyTorch Geometric的空间图神经网络城市功能推断编码实现

该教程构建了一个完整的空间图学习流程，使用city2graph库收集东京涩谷周边OpenStreetMap的真实POI和街道网络数据（含合成聚类备用方案），并设计局部密度、街道距离等空间特征。构建了六类邻近图（KNN、Delaunay、Gabriel、RNG、EMST、Waxman）以比较不同图拓扑，随后在齐次KNN图上训练两层GraphSAGE模型，根据空间结构和节点特征预测城市功能类别（餐饮、零售、教育、健康），并给出了测试准确率和宏观F1分数。流程还展示了利用桥梁边构建异构图类型，并通过PyTorch Geometric的to_hetero运行异构图神经网络前向传播，同时使用PCA可视化学到的嵌入和地理预测图。

MARKTECHPOST2026年6月11日重点

Perplexity将Deep Research移至Computer，调度20+前沿模型处理研究子任务，生成报告、演示文稿和仪表板

Perplexity将Deep Research模式整合到其多模型调度系统Computer中。升级后，它能自动将复杂问题拆分为子任务，并在20多个前沿模型之间分配执行。系统采用“代码化搜索”生成代码，并行运行数千个检索步骤，大幅提升代理浏览能力：BrowseComp基准得分从40.7%跃升至83.8%，Humanity’s Last Exam从36.4%升至50.5%。它能同时读取用户上传文件和实时网页，对每个声明都进行内联引用，并直接输出成品报告、幻灯片和交互式仪表板。开发者可通过按量付费的Perplexity Agent API使用同一技术栈，并配备deep-research预设。

MARKTECHPOST2026年6月10日

使用流式处理、Pandas 和 tiktoken 从 NVIDIA Nemotron-Pretraining-Code-v3 元数据构建代码数据集管道

本教程展示了如何以流式方式处理 NVIDIA 的 Nemotron-Pretraining-Code-v3 元数据索引，无需下载完整的多GB数据集。它创建了一个包含3万条记录的随机样本，派生出文件扩展名和路径深度等特征，并可视化了主要语言、扩展名、代码仓库和目录嵌套层次。工作流从元数据字段（repo、commit_id、rel_path）重建原始 GitHub URL，并尝试获取实际源文件，优雅地处理缺失或已删除的仓库。教程过滤出 Python 文件，使用 tiktoken 估算 token 数量，并提及完整数据集的规模约为 1.73 万亿个 token，涵盖 1.46 亿个文件。处理后的输出被保存为 Parquet 和 JSON 以供复用。

MARKTECHPOST2026年6月9日重点

哈佛与Perplexity最新研究：AI代理平均每次会话自主工作26分钟，而搜索仅33秒

哈佛大学与Perplexity联合研究分析了来自Perplexity Search和AI代理Perplexity Computer在90天内的一万对匹配会话。Computer每次会话自主工作26分钟（中位数9分钟），是Search的33秒（中位数14秒）的48倍。在匹配任务上，Computer加人类相比Search加人类将预估时间降低87%，成本降低94%，且其有意义的不满意率仅为1.3%（Search为2.9%）。Computer的查询还拓展了工作范围：跨职业查询占比升至59%（Search为50%），76%的查询需高阶认知（Search为55%），并且23%的查询解决了从未提交给Search的任务描述。