AI 工具应用¶
维度概述¶
AI 工具应用(AI Tool Proficiency) 评估学生使用 AI 工具的能力,包括工具选型、Prompt 工程、输出质量等。
评估目标
评估学生是否能够:
- 选择合适的 AI 工具
- 编写高质量的 Prompt
- 评估 AI 输出的质量
- 组合多种 AI 工具
- 考虑 AI 伦理问题
子指标详情¶
1. 工具选型合理性¶
可观测行为:是否根据任务特点选择了合适的 AI 工具(而非只用最熟悉的)
评估标准:
| 分数 | 说明 |
|---|---|
| 1-2 | 只使用最熟悉的工具,不考虑任务特点 |
| 3 | 能根据不同任务选择不同工具,但选择不够精准 |
| 4 | 能精准选择最适合任务的工具,并说明理由 |
| 5 | 能创新性地使用工具,或发现工具的新用法 |
数据采集方式:评审巡场记录
RSD 字段映射:
CompetencyStatement.observableBehavior- 可观测行为描述SkillAssertion.score- 评估分数
2. Prompt 工程质量¶
可观测行为:Prompt 是否结构化、是否有迭代优化、输出质量
评估标准:
| 分数 | 说明 |
|---|---|
| 1-2 | Prompt 简单直接,缺乏结构化 |
| 3 | Prompt 有一定结构,但优化不足 |
| 4 | Prompt 结构清晰,有迭代优化,输出质量高 |
| 5 | Prompt 设计精巧,迭代高效,输出质量突出 |
数据采集方式:评审观察 + 代码/Prompt 记录
RSD 字段映射:
Evidence.url- Prompt 记录链接SkillAssertion.score- 评估分数
3. 输出与任务匹配度¶
可观测行为:AI 输出是否真正解决了业务问题,而非"用了 AI 但答非所问"
评估标准:
| 分数 | 说明 |
|---|---|
| 1-2 | AI 输出与任务无关,或无法解决实际问题 |
| 3 | AI 输出部分解决任务,但有明显不足 |
| 4 | AI 输出较好地解决任务,质量可接受 |
| 5 | AI 输出高质量解决任务,有创新点 |
数据采集方式:路演评审
RSD 字段映射:
SkillAssertion.score- 评估分数SkillAssertion.assessorComment- 评估者评语
4. AI 工具组合使用¶
可观测行为:是否能组合多种 AI 工具完成复杂任务
评估标准:
| 分数 | 说明 |
|---|---|
| 1-2 | 只使用单一工具,无法处理复杂任务 |
| 3 | 能组合 2-3 种工具,但流程不够顺畅 |
| 4 | 能流畅组合多种工具,形成完整工作流 |
| 5 | 能创新性地组合工具,解决前所未有的问题 |
数据采集方式:过程观察
RSD 字段映射:
Evidence- 多条记录(不同工具的使用记录)SkillAssertion.score- 评估分数
5. AI 伦理意识¶
可观测行为:是否考虑了 AI 输出的准确性、偏见、版权等问题
评估标准:
| 分数 | 说明 |
|---|---|
| 1-2 | 完全不考虑 AI 伦理问题 |
| 3 | 了解 AI 伦理问题,但未在项目中体现 |
| 4 | 在项目中主动考虑 AI 伦理,并采取措施 |
| 5 | 对 AI 伦理有深入理解,并在项目中充分体现 |
数据采集方式:路演 QA 环节
RSD 字段映射:
SkillAssertion.assessorComment- 评估者评语SkillAssertion.score- 评估分数
数据采集流程¶
graph TB
subgraph "数据采集节点"
A[报名阶段]
B[命题发布]
C[Hackathon 执行]
D[中场展示]
E[最终路演]
F[赛后签发]
end
subgraph "采集方式"
G[评审巡场观察]
H[代码/Prompt 记录]
I[路演评审]
J[过程观察]
K[路演 QA 环节]
L[系统汇总]
end
C --> G
C --> H
C --> J
D --> I
E --> I
E --> K
F --> L
style G fill:#ff9800,color:#fff
style H fill:#ff9800,color:#fff
style I fill:#ff9800,color:#fff
style J fill:#ff9800,color:#fff
style K fill:#ff9800,color:#fff
style L fill:#ff9800,color:#fff
证据示例¶
代码仓库¶
# 示例:Prompt 工程代码
prompt_template = """
你是一个{role},需要完成以下任务:
{task_description}
要求:
1. {requirement_1}
2. {requirement_2}
3. {requirement_3}
请按照以下格式输出:
{output_format}
"""
Prompt 记录¶
用户:请帮我分析这个数据集的趋势
AI:我来帮您分析这个数据集。首先,让我检查数据的基本统计信息...
用户:请重点关注最近 3 个月的变化
AI:好的,我重新分析最近 3 个月的数据。根据分析结果...
路演视频¶
- 时长:5 分钟
- 内容:展示 AI 工具的使用过程和效果
- 重点:工具选型理由、Prompt 设计思路、输出质量评估
给 HR 的参考¶
如何评估候选人的 AI 工具应用能力
通过凭证中的以下信息,HR 可以评估候选人的 AI 工具应用能力:
- 分数:AI 工具应用维度的总分
- 子指标分数:每个子指标的详细分数
- 评语:评审员的具体评语
- 证据:代码仓库、Prompt 记录、路演视频