HEARD SHEEP — AI VOICE TASK ASSISTANT
听到了咩
以录音为主入口的 AI 任务助手,将口头交代、图片和文本中的零散信息,转化为可确认、可编辑、可追踪的任务计划。
问题场景
Problem
领导在走廊随口交代了几件事,回到工位已经记不全。
会议录音转了一大段文字,关键任务还是得自己一条条挑出来。
微信群里的语音和图片混着来,零散信息很难整理成可执行的待办。
用户需要的不是一次性的 AI 输出,而是能确认、编辑和持续跟进的任务管理能力。
核心流程
Flow
录音 / 上传音频 / 粘贴转写稿 / 上传图片
转写确认(浏览器 Web Speech API 或服务端 ASR)
AI 分析(DeepSeek 语义理解)
整理文本 / 候选任务 / 执行方案
选择、编辑并确认加入任务清单
任务详情、编辑、历史回看
真实界面
Screenshots首页 — 录音主入口与小羊品牌视觉

输入确认 — 粘贴转写稿或上传内容

AI 分析 — 整理文本、关键要求与时间信息

候选任务 — 选择、编辑并确认加入任务清单

任务页 — 已加入的任务分组展示

个人中心 — PWA 安装、偏好设置与数据管理

产品能力
Features录音与多模态输入
支持开始录音、暂停/继续、录音重点标记;上传音频;上传图片并提取文字;粘贴转写稿。覆盖会议、即时通讯、白板拍照等多种职场场景。
转写确认
录音或上传后进入转写确认环节,用户可校对和编辑转写文本,确保 AI 分析的输入质量。
AI 任务分析
基于 DeepSeek 进行语义分析,从非结构化对话中输出整理文本、候选任务、执行方案和缺失信息,生成结构化结果。
候选任务选择与编辑
AI 生成的内容先停在候选区,用户可逐条选择、编辑任务标题和描述,确认后才加入正式任务清单。
任务管理闭环
从录音到任务生成、编辑、确认、完成的完整闭环。支持优先级筛选、状态管理、历史回看。
图片文字提取
支持多图上传,通过图片理解模型自动提取图片中的文字,预填到确认页,再交给 AI 生成任务。
移动端优先与 PWA
375px 手机容器优先设计,奶油紫 + 黑白轻工具风,小羊品牌视觉,支持 PWA 安装到桌面。
Mock 降级
未配置 API 密钥或调用失败时自动回退到 Mock 模式,保证演示流程不断裂,适合离线展示。
技术实现
Technical
页面结构
/ — 首页(录音入口)
/result/[id] — AI 分析结果页(整理文本 / 候选任务 / 执行方案)
/tasks — 任务清单
/task/[id] — 任务详情
/history — 历史记录
/me — 个人中心
技术栈
前端框架
UI 组件
AI 能力
数据校验
存储
部署
当前状态
Status
可运行 Web MVP,移动端优先设计,已支持 /sheep 路径部署,当前为单用户本地 MVP。