MARKTECHPOST··重点
Qwen 团队发布了 Qwen-RobotSuite,包含三款独立的具身 AI 基础模型。Qwen-RobotManip 基于 Qwen3.5-4B 构建,是一个视觉-语言-动作模型,可将异构操作数据对齐到统一的 80 维动作向量,在 RoboChallenge Table30-v1 上排名第一,并展现出强大的跨具身迁移能力。Qwen-RobotWorld 是一个语言条件的视频世界模型,采用 60 层双流 MMDiT 和冻结的 Qwen2.5-VL 编码器,在 EWMBench 和 DreamGen Bench 上均获总体第一。Qwen-RobotNav 是基于 Qwen3-VL 的可扩展导航模型,具有参数化观察接口,在 VLN-CE RxR 上达到 76.5% 成功率,并支持智能体规划。RobotManip 和 RobotNav 已在 GitHub 开源;RobotWorld 以论文形式发布。
MARKTECHPOST·
本教程流式处理了FineWeb sample-10BT的3,000篇文档,无需下载完整的多TB语料。复现了Gopher、C4及自定义质量过滤器,由于数据已预过滤,大部分文档通过检测。使用128个哈希排列和0.7阈值的MinHash去重仅发现极少数近似重复对,证实了每次爬取已去重。通过与存储字段对比验证GPT-2分词数,平均绝对差接近0,高度一致。分析涵盖token分布、语言得分、每字符token数和顶级域名,为大规模语料预处理管线提供了可操作的参考。
MARKTECHPOST·
该教程构建了一个完整的空间图学习流程,使用city2graph库收集东京涩谷周边OpenStreetMap的真实POI和街道网络数据(含合成聚类备用方案),并设计局部密度、街道距离等空间特征。构建了六类邻近图(KNN、Delaunay、Gabriel、RNG、EMST、Waxman)以比较不同图拓扑,随后在齐次KNN图上训练两层GraphSAGE模型,根据空间结构和节点特征预测城市功能类别(餐饮、零售、教育、健康),并给出了测试准确率和宏观F1分数。流程还展示了利用桥梁边构建异构图类型,并通过PyTorch Geometric的to_hetero运行异构图神经网络前向传播,同时使用PCA可视化学到的嵌入和地理预测图。
MARKTECHPOST··重点
Perplexity将Deep Research模式整合到其多模型调度系统Computer中。升级后,它能自动将复杂问题拆分为子任务,并在20多个前沿模型之间分配执行。系统采用“代码化搜索”生成代码,并行运行数千个检索步骤,大幅提升代理浏览能力:BrowseComp基准得分从40.7%跃升至83.8%,Humanity’s Last Exam从36.4%升至50.5%。它能同时读取用户上传文件和实时网页,对每个声明都进行内联引用,并直接输出成品报告、幻灯片和交互式仪表板。开发者可通过按量付费的Perplexity Agent API使用同一技术栈,并配备deep-research预设。
MARKTECHPOST·
本教程展示了如何以流式方式处理 NVIDIA 的 Nemotron-Pretraining-Code-v3 元数据索引,无需下载完整的多GB数据集。它创建了一个包含3万条记录的随机样本,派生出文件扩展名和路径深度等特征,并可视化了主要语言、扩展名、代码仓库和目录嵌套层次。工作流从元数据字段(repo、commit_id、rel_path)重建原始 GitHub URL,并尝试获取实际源文件,优雅地处理缺失或已删除的仓库。教程过滤出 Python 文件,使用 tiktoken 估算 token 数量,并提及完整数据集的规模约为 1.73 万亿个 token,涵盖 1.46 亿个文件。处理后的输出被保存为 Parquet 和 JSON 以供复用。
MARKTECHPOST··重点
哈佛大学与Perplexity联合研究分析了来自Perplexity Search和AI代理Perplexity Computer在90天内的一万对匹配会话。Computer每次会话自主工作26分钟(中位数9分钟),是Search的33秒(中位数14秒)的48倍。在匹配任务上,Computer加人类相比Search加人类将预估时间降低87%,成本降低94%,且其有意义的不满意率仅为1.3%(Search为2.9%)。Computer的查询还拓展了工作范围:跨职业查询占比升至59%(Search为50%),76%的查询需高阶认知(Search为55%),并且23%的查询解决了从未提交给Search的任务描述。