跳转至

AI 工具应用

维度概述

AI 工具应用(AI Tool Proficiency) 评估学生使用 AI 工具的能力,包括工具选型、Prompt 工程、输出质量等。

评估目标

评估学生是否能够:

  • 选择合适的 AI 工具
  • 编写高质量的 Prompt
  • 评估 AI 输出的质量
  • 组合多种 AI 工具
  • 考虑 AI 伦理问题

子指标详情

1. 工具选型合理性

可观测行为:是否根据任务特点选择了合适的 AI 工具(而非只用最熟悉的)

评估标准

分数 说明
1-2 只使用最熟悉的工具,不考虑任务特点
3 能根据不同任务选择不同工具,但选择不够精准
4 能精准选择最适合任务的工具,并说明理由
5 能创新性地使用工具,或发现工具的新用法

数据采集方式:评审巡场记录

RSD 字段映射

  • CompetencyStatement.observableBehavior - 可观测行为描述
  • SkillAssertion.score - 评估分数

2. Prompt 工程质量

可观测行为:Prompt 是否结构化、是否有迭代优化、输出质量

评估标准

分数 说明
1-2 Prompt 简单直接,缺乏结构化
3 Prompt 有一定结构,但优化不足
4 Prompt 结构清晰,有迭代优化,输出质量高
5 Prompt 设计精巧,迭代高效,输出质量突出

数据采集方式:评审观察 + 代码/Prompt 记录

RSD 字段映射

  • Evidence.url - Prompt 记录链接
  • SkillAssertion.score - 评估分数

3. 输出与任务匹配度

可观测行为:AI 输出是否真正解决了业务问题,而非"用了 AI 但答非所问"

评估标准

分数 说明
1-2 AI 输出与任务无关,或无法解决实际问题
3 AI 输出部分解决任务,但有明显不足
4 AI 输出较好地解决任务,质量可接受
5 AI 输出高质量解决任务,有创新点

数据采集方式:路演评审

RSD 字段映射

  • SkillAssertion.score - 评估分数
  • SkillAssertion.assessorComment - 评估者评语

4. AI 工具组合使用

可观测行为:是否能组合多种 AI 工具完成复杂任务

评估标准

分数 说明
1-2 只使用单一工具,无法处理复杂任务
3 能组合 2-3 种工具,但流程不够顺畅
4 能流畅组合多种工具,形成完整工作流
5 能创新性地组合工具,解决前所未有的问题

数据采集方式:过程观察

RSD 字段映射

  • Evidence - 多条记录(不同工具的使用记录)
  • SkillAssertion.score - 评估分数

5. AI 伦理意识

可观测行为:是否考虑了 AI 输出的准确性、偏见、版权等问题

评估标准

分数 说明
1-2 完全不考虑 AI 伦理问题
3 了解 AI 伦理问题,但未在项目中体现
4 在项目中主动考虑 AI 伦理,并采取措施
5 对 AI 伦理有深入理解,并在项目中充分体现

数据采集方式:路演 QA 环节

RSD 字段映射

  • SkillAssertion.assessorComment - 评估者评语
  • SkillAssertion.score - 评估分数

数据采集流程

graph TB
    subgraph "数据采集节点"
        A[报名阶段]
        B[命题发布]
        C[Hackathon 执行]
        D[中场展示]
        E[最终路演]
        F[赛后签发]
    end

    subgraph "采集方式"
        G[评审巡场观察]
        H[代码/Prompt 记录]
        I[路演评审]
        J[过程观察]
        K[路演 QA 环节]
        L[系统汇总]
    end

    C --> G
    C --> H
    C --> J
    D --> I
    E --> I
    E --> K
    F --> L

    style G fill:#ff9800,color:#fff
    style H fill:#ff9800,color:#fff
    style I fill:#ff9800,color:#fff
    style J fill:#ff9800,color:#fff
    style K fill:#ff9800,color:#fff
    style L fill:#ff9800,color:#fff

证据示例

代码仓库

# 示例:Prompt 工程代码
prompt_template = """
你是一个{role},需要完成以下任务:
{task_description}

要求:
1. {requirement_1}
2. {requirement_2}
3. {requirement_3}

请按照以下格式输出:
{output_format}
"""

Prompt 记录

用户:请帮我分析这个数据集的趋势
AI:我来帮您分析这个数据集。首先,让我检查数据的基本统计信息...
用户:请重点关注最近 3 个月的变化
AI:好的,我重新分析最近 3 个月的数据。根据分析结果...

路演视频

  • 时长:5 分钟
  • 内容:展示 AI 工具的使用过程和效果
  • 重点:工具选型理由、Prompt 设计思路、输出质量评估

给 HR 的参考

如何评估候选人的 AI 工具应用能力

通过凭证中的以下信息,HR 可以评估候选人的 AI 工具应用能力:

  1. 分数:AI 工具应用维度的总分
  2. 子指标分数:每个子指标的详细分数
  3. 评语:评审员的具体评语
  4. 证据:代码仓库、Prompt 记录、路演视频