SJMMA 2026 F - 你养小龙虾了吗

AI 智能体 (Claw) 的安全风险量化 · Token 成本效益 · AI 依赖阈值分析

一、量化 AI 智能体安全风险

背景：Claw 是一个自动执行多步任务的 AI 智能体工具。它访问文件、代码、网络等资源，在信息处理过程中面临安全风险：幻觉输出、数据泄露、提示注入攻击、向控制权丢失。我们量化三种运行模式下的综合安全风险。

1.1 安全风险分类体系

风险类别	描述	严重度 S (1-10)	基础概率 P₀	后果
幻觉输出	生成不正确/虚构的代码或信息	6	0.15	代码bug、错误决策
数据泄露	敏感信息暴露到外部	9	0.05	隐私/安全事故
提示注入	恶意输入控制AI行为	8	0.08	执行非预期操作
权限失控	AI执行超出授权的操作	10	0.03	系统损坏/数据丢失
输出质量	代码质量低、不符合要求	4	0.20	返工、效率降低
过度依赖	学生失去独立思考能力	7	0.25	长期学习能力下降

1.2 三种运行模式

Safe Mode

低权限、每步确认
效率:低 | 风险:低

Default Mode

标准权限、部分确认
效率:中 | 风险:中

YOLO Mode

全权限、无需确认
效率:高 | 风险:高

1.3 综合风险评分模型

RiskScore(mode) = Σ_k S_k · P_k(mode) · D_k(mode)

P_k(mode) = P_0,k · M_mode (模式风险乘数)
D_k(mode) = 检测/缓解失败率 (Safe:低, Default:中, YOLO:高)
M_safe = 0.3, M_default = 1.0, M_yolo = 2.5

使用频率 (次/天) 10

任务复杂度 (1-10) 5

用户安全意识 (1-10) 6

网络暴露程度 (1-10) 4

综合风险分

风险等级

最大风险项

期望损失(元/月)

0 (安全)50 (中等)100 (极高)

三模式风险对比

二、计算成本效益

目标：以一个学期(约 20 周)为周期，量化使用 Claw 的总成本和总收益，计算净效益与 ROI。

NetBenefit = Σ(TimeSaved · TimeValue + QualityGain) - Σ(TokenCost + ErrorCost + RiskCost)

2.1 成本项模型

Token 消耗成本

C_token = Σ_week N_tasks · AvgTokens · P_token
输入 Token: ~2000/次, 输出 Token: ~3000/次
价格: 输入 $3/MTok, 输出 $15/MTok (Claude级)

使用强度	次/周	Token/月	月成本(¥)
轻度	20	400K	~35
中度	60	1.2M	~105
重度	150	3.0M	~260

错误/风险成本

C_error = P(error) · AvgFixTime · TimeValue
C_risk = Σ_k P_k · S_k · UnitLoss_k

错误类型	发生率	修复时间(h)	月成本(¥)
幻觉代码	15%	0.5	~30
逻辑错误	10%	1.0	~40
安全漏洞	3%	2.0	~24

2.2 效益项模型

TimeSaved_week = N_tasks · (T_manual - T_AI) · (1 - ErrorRate · ReworkFactor)

QualityGain = BaseScore · (1 + α · VCI · min(Skill/5, 1)) (VCI 为 AI 辅助程度)

2.3 学期成本效益模拟器

每周使用次数 40

平均 Token/次 (千) 5

手工完成耗时 (min/次) 45

AI 辅助耗时 (min/次) 15

时间价值 (¥/h) 30

运行模式 Default

学期总成本(¥)

学期总效益(¥)

净效益(¥)

ROI

节省时间(h)

Token费(¥)

错误成本(¥)

推荐使用?

三、AI 能力依赖阈值分析

核心问题：AI 辅助何时从"促进学习"变为"替代思考"？我们建立学习效果与 AI 依赖度的倒 U 型关系模型，寻找最优依赖阈值。

L(r) = L_base · (1 + α · r · (1 - r) - β · r^k)

L(r): 学习效果, r: AI 依赖度 [0,1], α: 辅助增益, β: 依赖损耗, k: 非线性指数 (k>1 体现过度依赖的加速危害)

3.1 学习效果曲线

辅助增益 α 2.5

依赖损耗 β 1.8

非线性指数 k 2.5

学生基础水平 (1-10) 5

最优依赖度

最优学习效果

临界阈值

安全区间

3.2 不同学生群体分析

基础强的学生最优依赖度更高（能更好地利用AI而不丧失判断力），基础弱的学生应更谨慎使用AI。

3.3 Token 使用合理性评估

学期Token预算(¥):

3.4 综合建议矩阵

学生类型	推荐模式	建议VCI	Token预算/月	关键建议
编程新手 (基础1-3)	Safe Mode	0.20-0.35	¥50-80	以学习为主，AI仅做解释器
有基础者 (基础4-6)	Default Mode	0.35-0.55	¥80-150	AI辅助调试和框架搭建
进阶学生 (基础7-8)	Default Mode	0.50-0.70	¥100-200	AI加速重复工作，保留核心设计
高水平 (基础9-10)	Default/YOLO	0.60-0.80	¥150-300	AI全面协作，专注架构与创新

3.5 长期影响模拟

关键发现：适度使用AI(VCI 0.3-0.5)的学生学期末综合能力最强；过度依赖(VCI>0.7)的学生初期进步快但后期能力增长停滞甚至倒退。