📌 一句话看懂
你需要为 AI 大模型实战表现进行多维度专业评分。核心是评估与训练 AI ,不是外包开发,无需你亲自写代码交付业务。
💰 收益与节奏
- 单价回报:800 元 / 任务
- 时间投入:预计 2 小时 / 题
- 工作节奏:纯线上,无排班,时间自由,随时可做,自主在任务池领题。
💻 你具体需要做什么?
只需完成以下四步闭环:
- 领题:领取一道真实的后端项目实战编程题(题目库已提供,无需你原创)。
- 测试:在我们配置好的 Docker 环境中,让 4 个不同的 AI 模型分别跑一遍解题过程。
- 点评:观察 AI 的每轮表现,撰写 100 字以上的核心过程评价(精准指出 AI 做了什么、哪里做对了、逻辑缺陷在哪)。
- 评分:严格按照提供的 7 个专业维度拆解验收标准,为 AI 的代码输出打分,打包提交即算完成。
🎯 我们在寻找这样的你
- 技术栈对口:后端 / 全栈工程师,熟练掌握 Java / Python / Go / C++ / JavaScript 中的任意一种。
- 懂 AI 工具:日常使用过主流 AI 编程助手或客户端(如 Claude Code 、GitHub Copilot 、通义灵码等)。
- Code Review 能力强:具备敏锐的技术直觉,能一眼看穿“AI 写的代码对不对、坏味道在哪、工程规范差在哪里”。
🚫 明确不需要做的事
- ✗ 不需要你亲自写代码交付。
- ✗ 不需要你给 AI 写的代码修 Bug 。
- ✗ 不需要你出原创算法题。
🚀 申请加入流程
- 注册报名岗位: https://talent.meetchances.com/jobs?_fr=v2ex&job_id=160130
- 提交个人简历。
- 完成 20-25 分钟线上 AI 面试(手机即可完成,时间灵活自选)。
- 通过后即可加入项目群,正式开始领题赚钱!
岗位职责
-
参与 AI Coding 产品相关的数据标注(如代码 Rubric 标注、代码质量评价等)
-
根据项目需求完成 小型编程任务(脚本编写、调试、算法实现等)
-
对 AI 编程助手(如 Cursor 、Claude Code 、Trae 、通义灵码等)的输出进行对比、评价与优化
-
提供使用体验反馈,协助改进 AI 工具的用户体验
任职要求
-
熟悉至少一门编程语言( Python / Java / C++ / Go / JavaScript 等),能够独立阅读和编写代码
-
有一定的 AI 编程产品(如 Cursor 、Claude Code 、Copilot 、Trae 、通义灵码等)使用经验
-
本科及以上学历,计算机科学、软件工程或相关专业背景优先
-
对前沿技术有持续的热情和学习能力,有开源社区贡献或技术博客分享者优先
筛选流程
申请地址