机器没有语言能思考吗?
Yann LeCun押注十亿美元,认为机器可以在没有语言的情况下思考,并指出目前的聊天机器人是死胡同,真正的智能需要学习物理的世界模型。该帖子提出两个担忧:当前的AI测试依赖语言,因此世界模型可能无法被正确衡量,以及纯粹基于物理理解而没有语言的能力是否能被视为真正的智能。作者认为单纯的聊天机器人或世界模型都不够,可能需要两者的结合才能实现真正的智能。
Thinkgap 信息流
页面仅读取已加工的 items 表,并以中英双语呈现。
7 条内容
Yann LeCun押注十亿美元,认为机器可以在没有语言的情况下思考,并指出目前的聊天机器人是死胡同,真正的智能需要学习物理的世界模型。该帖子提出两个担忧:当前的AI测试依赖语言,因此世界模型可能无法被正确衡量,以及纯粹基于物理理解而没有语言的能力是否能被视为真正的智能。作者认为单纯的聊天机器人或世界模型都不够,可能需要两者的结合才能实现真正的智能。
Anthropic 发布了 Claude Fable 5,这是他们公开可用的最强模型,以及仅限于网络防御合作伙伴的 Claude Mythos 5。Fable 5 展示了卓越性能:一天内迁移了 5000 万行 Ruby 代码库,仅使用原始截图击败了《宝可梦 火红》,并在 FrontierCode 评估中得分最高。Mythos 5 自主进行了跨 138 个物种的基因组研究,以缩小 100 倍的模型超越了已发表的《科学》论文。安全方法采用分类器,在敏感查询时静默回退到 Opus 4.8,在超过 1000 小时的测试中未发现通用越狱。定价为每百万输入令牌 10 美元、输出令牌 50 美元,有限计划在 6 月 22 日前可免费使用。
OpenAI的Parameter Golf竞赛吸引了1016名研究者,在44天内提交了2048个PR,只有47个进入官方排行榜。由Weco打造的自主智能体Aiden贡献了其中7个记录,超过第二名人类选手(3个)的两倍以上,它在一台GPU上自主运行了22天,消耗的计算资源不到社区总量的4%。Aiden的PR成为竞赛中被引用最多的,人类研究者直接在其工作基础上构建。在Aiden停滞5天后,一位人类选手在其最后PR上添加了新分词器,Aiden随后将该分词器与自身积累的改进融合,创造了整个竞赛中最大的分数跃升。最终,Aiden仅凭合并记录数量领先,最佳单项分数排名第8。
预印本平台arXiv将对提交AI生成的低质量论文(俗称‘AI垃圾’)的研究人员实施一年封禁。此举旨在维护学术投稿的质量与诚信。该政策针对的是那些没有实质性科学贡献、由AI自动生成的稿件。这一决定反映了学术界对AI在出版中滥用行为的日益关注。
用户构建了一个专为arXiv论文设计的语义搜索引擎。它提供AI生成的摘要,以便快速理解论文内容。该工具还对论文中的声明进行分类,并支持多篇论文之间的直接比较。这旨在帮助研究人员高效地导航和评估学术文献。该引擎利用AI来增强文献综述过程。
帖子指出,尽管AI驱动的自动化进展迅速,但开采品位日益下降的矿石面临的物理限制阻碍了真正的富足。作者声称随着消费增长,资源通胀猖獗,而材料科学突破仍遥不可及。警告不要被‘煤气灯效应’迷惑,认为仅靠自动化就能解决资源约束。尽管投入巨资,仍未出现重大突破。整体语气批评了关于AI解决物质稀缺的乐观叙事。