本文展示了一项利用小型开源语言模型为内部威胁检测生成安全运营中心(SOC)叙事文本的实操研究。实验基于 CERT R4.2 数据集和 Qwen3 模型,对比了四种方法:零样本提示、少样本提示、基于 LoRA 的有监督微调(SFT LoRA)以及组相对策略优化(GRPO)。该研究给出了使用小型大语言模型解读内部威胁的实用流程,突显了开源模型微调的易用性。
Loading / 加载中
AI 论文、发布、工具与金融信号
Loading / 加载中
Infogap 信息流
页面仅读取已加工的 items 表,并以中英双语呈现。
第 1 / 2 页
本文展示了一项利用小型开源语言模型为内部威胁检测生成安全运营中心(SOC)叙事文本的实操研究。实验基于 CERT R4.2 数据集和 Qwen3 模型,对比了四种方法:零样本提示、少样本提示、基于 LoRA 的有监督微调(SFT LoRA)以及组相对策略优化(GRPO)。该研究给出了使用小型大语言模型解读内部威胁的实用流程,突显了开源模型微调的易用性。
本教程为机器学习工程师提供了LLM核心概念的实用概述。从标记、Transformer架构和嵌入等基础元素开始,然后涵盖提示工程、检索增强生成(RAG)和微调等高级技术。该指南强调培养合理的工程判断力,以超越试错式的盲目提示。未涉及新研究或产品发布,仅作为教育资源。
提供的文章片段仅包含一个比喻,将预训练模型比作能演奏各种音乐风格的专业钢琴家。没有包含微调方法、步骤或示例的具体信息。全文内容不可获取。
Harness-1是一个200亿参数的检索子代理,通过有状态框架将搜索决策与簿记分离。它在八个基准测试中平均达到0.730的策划召回率,超越其他开放模型,接近前沿性能。该模型通过监督微调学习接口操作,通过强化学习优化搜索策略,使用有限工具集和工作记忆。权重和框架代码已在Hugging Face和GitHub上公开发布。
Google发布了Colab CLI,这是一个命令行界面,将本地终端连接到远程Colab运行时。它允许开发者和AI代理在不离开终端的情况下在云端GPU和TPU上运行代码。该工具采用Apache 2.0开源许可,并附带了供代理使用的技能文件(COLAB_SKILL.md)。它支持配置T4、A100等GPU以及TPU,并演示了针对Gemma 3 1B模型的微调流程。该CLI专为脚本化、自动化和代理驱动的工作流设计。
本教程演示如何微调小型语言模型Mistral Small 3.1以进行情绪识别。重点处理不平衡的训练集,并对社交媒体帖子中的15种不同情绪进行分类。指南提供了Python代码和实际操作步骤。这是一个将微调应用于实际情感分析的实践方法。