2025 秋季学期 北京中关村学院 现代软件工程课的团队项目,从硬件项目到小程序,从租房到基因组分析,到记笔记,问答... 百花齐放。
这些项目的千帆竞发图: https://bbs.zgcai.icu/smart_backend/se2509/
这些项目都会如预想那样成功么?
电影界有一个职业叫 ‘影评家’,他们不拍电影,也不演电影,但是他们阅片无数,对各种电影和电影的主角配角、摄影、编剧、导演、艺术性...等等都可以洋洋洒洒地评论很久。为什么呢?因为影评家有很多间接经验,见多识广,写过很多评论,也非常了解观众和社会。 那么,AI 也是见多识广,还能写很多程序,它对软件工程项目,也可以当一个影评家。 对于学生的软件工程项目,在没有发布前,根据项目的说明书, AI 就可以从影评家的角度侃侃而谈,下面就是 AI 对这些项目的风险分析:
| Project |
Risks |
| AI量化投资 - 热点 |
合规风险:
| 强化安全隔离 |
提供严格“沙盒模式”为默认(即不触发真实下单),用户需手动启用实盘。 |
| 添加风险免责声明 |
在文档首页与代码 README 明确标注“教育研究用途,不构成投资建议”。 |
项目的核心卖点是:
“展示AI的每一步推理过程,让交易决策透明可解释。”
然而,现实中语言模型(即便如 DeepSeek R1)在高噪声金融场景下仍存在幻觉、误判、上下文混淆等问题。
这意味着 —— AI看似“在思考”,但未必在“正确地交易”。
风险表现
-
AI推理链 ≠ 决策可靠性
-
模型无法理解市场动态
-
金融市场的时序性、噪声性极强,而语言模型缺乏价格预测与风险建模的内生结构。
-
LLM 若直接决策买卖指令,极易“过度反应”或“延迟反应”,导致亏损。
-
其“决策可解释性”在学术上是伪指标:能解释 ≠ 能盈利。
-
Prompt与策略不稳定
-
缺乏模型回测与评估体系
|
| Echo - 交互式写作与自我探索 |
风险 1: 产品-市场适配(PMF)风险很高
原因分析
-
项目定义了一个较为宽泛的目标人群:年轻人、职场人士、创业者、创作者。文档中列出了不少功能(智能写作、多声音反馈、图片生成、深度分析等)但痛点定义较为“写作缺乏反馈、思绪混乱”这类较宽泛。 f2j.space+1
-
功能范围十分丰富:从「实时多声音评论」「时间线回顾」「行为模式分析」「智能体定制」到「名人匹配」等等。 f2j.space
-
而“商业模式”初期指标相对保守,例如 Alpha 后目标活跃用户 “10-20位”、7 天留存 > 50%、至少5位愿付费。 f2j.space
-
在早期阶段功能多而用户验证少的情境下,很容易发生“功能先行、用户不买账”的情况。也就是说,团队可能会在做很多技术+产品的事情,但并不清楚是否真正契合用户最关键痛点。
-
从投资视角看,一个“写作+AI反馈”工具市场虽有机会,但竞争激烈(已有多家写作/日记+AI产品),差异化是否足够、用户愿意付费的意愿是否强、留存机制是否健全,这些都尚不明确。文档虽提“渐进式评论机制尚无竞品” f2j.space,但从市场进入来看,这仍是一个较高风险假设。
风险 2:技术复杂度与执行风险/资源消耗风险
原因分析
-
项目功能设计相当复杂:包括多声音AI系统、写作过程实时评论、情绪上下文调整、图片生成、行为模式分析、智能体定制等。 f2j.space
-
团队规模为5 人,且预计Alpha阶段总工时为约350小时(5 人×14天×5h/天) f2j.space。对于这么多功能而言,时间安排偏紧。
-
AI/LLM相关成本和技术风险:例如实时多声音反馈、情绪上下文、图片生成,这些都依赖于成熟模型/生成模型/图片生成桥接,可能存在性能成本、审核、用户体验不成熟的问题。文档中也提及“LLM成本失控”作为预-mortem 风险之一。 f2j.space
-
在资源受限、团队经验可能尚未涵盖所有技术栈(前端写作系统、后端LLM服务、图片生成、智能体定制、用户运营)情况下,项目容易出现“功能拖延、Bug集中、用户体验差”风险。
|
| 三角洲自动剪辑软件/网站 - 针对游戏爱好者 |
风险一:市场规模与验证风险(Product–Market Fit)
问题根源:
风险二:技术实现与算法泛化风险
问题根源:
-
技术方案依赖 “特化型UI识别 + OCR + 程序化剪辑”,对游戏界面结构高度依赖。
-
《三角洲》UI元素(击杀标识、倒地图标、结算面板)变化频繁,未来版本或语言包更新即可导致算法失效。
-
当前方案依赖“优化的卷积匹配技术”,但未说明:
-
是否具备抗噪、模糊、分辨率差异的鲁棒性?
-
OCR 精度与帧率能否支撑实时分析?
-
是否能处理直播延迟与多源画面?
-
技术瓶颈在于:如何让识别算法具备可迁移性和维护性,否则每更新一版游戏都需重写逻辑。
|
| 高效推荐算法开发驱动的 siyuan 笔记插件 |
风险点
-
用户规模增长难度:当前产品可能服务小众用户(例如特定UP主或特定剪辑场景)。若要扩大用户基础,需要新的功能、营销、渠道、支持,这可能涉及更多成本。
-
付费转化率与持续付费风险:下载数与付费转化比例不明确。若大多数用户仅下载试用,不愿付费或续费,收入增长会受限
-
算法优势可能不是长期不可替代:随着市场、平台、用户需求变化或技术演进(如AI/ML模型的大规模开源),当前算法可能会逐渐失去优势。
-
算法仅适用于当前版本场景:如果算法高度定制、场景窄(如特定视频剪辑类型、特定用户群体),其扩展性可能低,一旦场景变化或用户需求转移,就可能快速失效。
-
算法效果/体验未系统化验证:已有下载几千,规模虽有,但尚不足以证明算法长期、广泛有效。若用户体验差、留存低、转化弱,则优势无法持续。
|
| PQ v.next - 在问答中更好地教和学 |
风险点
-
题目生成质量不稳定:LLM生成的题目是否准确反映教案要点、难度与语言适合学生,教师是否认为可以“直接用”而非“需大量修改”尚无大量验证。
-
教师信任建立难度:教师是保守用户,出题工具若生成题目错漏、不能与教学目标完全对应,会影响教师继续使用。
-
学生使用粘性低:学生若觉得题目简单/与课堂不匹配,则可能不继续使用,影响留存。
-
竞争压力:已有诸多教学辅助出题工具/平台,差异化是否足够、用户是否愿意转向或付费尚不明确。
|
| 大模型新闻推荐 - 帮你选择 |
风险点
-
主流竞品强势(今日头条、腾讯新闻、知乎等)已深度绑定用户生态,掌握行为数据与社交链。
-
用户对“新推荐源”普遍存在信任门槛:若个性化推荐初期效果差、内容不稳定、界面体验不佳,会迅速流失。
-
项目目前并未定义精准目标用户细分:它同时面向学生、职场人士、泛新闻读者——过宽的定位意味着早期产品无法针对特定场景(如财经、学术、科技)快速建立粘性。
-
冷启动问题会放大初期体验落差:没有行为数据的情况下,LLM 生成的推荐语义虽精准,但不一定“有温度”或“持续相关”。
-
模型调用成本高:实时语义理解和多轮对话推荐需要频繁调用 LLM 接口,若每日数千次请求,成本将迅速攀升。
-
响应延迟与可扩展性:LLM 推理速度慢于传统推荐模型;若延迟超 2 秒,用户体验会显著下降。
-
数据更新频率高:新闻类数据要求“时效性”。每小时数千条新内容意味着系统必须支持快速索引与重计算,这对存储与计算架构是巨大压力。
-
模型可靠性与事实性问题:LLM 可能生成幻觉(hallucination)或误解新闻语境,导致推荐内容偏差、甚至推送错误信息,损害可信度。
|
| 汪洁步道 - 狗狗清洁(硬件) |
这类设备的核心风险不是“能否工作”,而是“狗愿不愿意用”。
-
宠物配合度不可控:
-
工程复杂度高:
-
清洁效果与体验的平衡难度大:
-
刷得太轻 → 清不干净;
-
刷得太重 → 狗受伤或排斥;
-
烘干时间长、噪音大、气味重 → 用户体验下降。
-
测试样本不足:
|
|
FocusPet:一个集成了待办事项、
番茄钟与养成体验的效率工具
|
风险:是过度工程化(over-engineering)的典型案例。
具体风险点
-
集成地狱风险 (Integration Hell)
-
三个独立的运行环境要保证实时状态同步(番茄钟进度、分心检测、宠物状态)。
-
WebSocket 通信涉及消息丢失、延迟、重连处理、状态不一致等复杂问题。
-
CI/CD 流程虽然规范,但多模块 monorepo 的构建顺序、依赖关系、版本控制一旦错位,调试代价指数级上升。
-
关键人物瓶颈 (Key Person Bottleneck)
-
UX 割裂风险 (Fragmented UX)
-
用户交互分散在两套 UI:一个是 Web 窗口(任务管理),一个是独立 Godot 窗口(宠物动画)。
-
状态不同步(点击“开始”后宠物反应慢半拍)会让“情感陪伴”核心体验崩塌。
-
若用户觉得系统“延迟”“卡顿”“假装互动”,整个情感闭环失效。
-
过度依赖新技术堆叠
产品定位方面的具体风险点
-
目标用户不聚焦
-
情感激励机制未经验证
-
缺乏用户留存设计
-
与竞品差异不足
|
|
端到端基因组分析平台
提供统一的图形化界面、可观测的流程编排、
自动化下游分析与可复现的工程化部署
|
风险表现
-
算法性能优化难以达标
-
系统资源与调度管理复杂度高
-
内存与存储瓶颈
-
团队经验风险
风险表现
-
科研环境碎片化
-
实验室运行环境多样(Linux 集群、Slurm 调度、手动部署)。
-
GUI 工具可能无法在 HPC 环境中使用(大多数集群无图形界面)。
-
若 cax 假设用户在本地运行,就无法处理超大规模任务。
-
科研人员信任壁垒
-
可视化与自动报告的“虚假易用性”
|
|
Photo album for School:
做一个校内的图库网站,可以支持校内各级单位内部
的照片资源内部储存备份及共享。
|
风险表现
-
替代方案太近而太方便
-
使用频率低、留存难
-
痛点强度被低估
-
技术方面问题
|
| 厂房AI租小程序:发朋友圈一样实时推房源。 |
风险表现
-
目标市场过于分散,难以集中验证
-
B 端客户(托管公司)验证路径模糊
-
竞争替代品认知差异
-
项目认为“贝壳、自如”聚焦租前、自己聚焦租后”,但实际上,许多中小物业公司已使用轻量 CRM 或房源管理 SaaS(如房管家、易房宝等)。
-
租客端的“报修+支付”功能被支付宝房租管家、小区物业公众号轻松替代。
-
换句话说:这个市场不是空白,而是“低认知度+高度碎片化”。
-
三方平台启动需要强约束或激励机制
-
若无房东或托管方的统一要求,租客不会主动迁移。
-
没有网络效应前,使用者越少,价值越低。
-
系统耦合与调试成本极高
-
团队分工与能力不匹配
-
测试和 CI 成本指数级增长
-
维护风险(知识集中与单点故障)
-
微服务并未带来短期收益
|
| 工分易 |
风险结构是典型的“双高风险创新产品”:
一方面概念领先、机制复杂;另一方面目标市场的行为惯性极强。
CrewCut 的核心竞争力在于:
“通过自评 + 互评 + 算法 → 生成贡献排名 → 自动分配利益,并上链存证”。
也就是说,整个系统的信任与公信力,全靠算法机制的“公平性”和“不可操控性”。
然而,现实中这类“自评 + 互评 + 算法”体系极容易被人性破坏 —— 这正是此类产品最难落地的“机制陷阱”。
技术风险表现
-
团队内“串评分”或“对赌行为”风险极高
-
用户间存在博弈激励(我打你高,你也给我高),导致算法结果被操控。
-
即便加入“去极值”,仍可通过联盟策略(3人互捧、2人低打)破坏平衡。
-
实际上,任何分配体系中信任成本无法完全算法化消解。
-
算法一旦被“玩坏”,产品核心价值崩塌
-
缺乏真实验证样本支撑算法调优
-
复杂的激励机制难以被用户理解与接受
产品风险表现
-
市场需求痛点被低估
-
场景碎片化,难以规模复制
-
早期推广依赖人工地推与教育成本
-
付费意愿与转化路径不明
-
生态平台位势薄弱
|
| MyMind 多维思维导图 SiYuan 插件 |
项目最大的执行风险。Alpha 阶段的范围(三类导图、关联线、7 种格式导出、稳定性修复)相较于极其有限的资源配置,显得非常激进。
-
时间预算极紧: 整个项目预算仅为 120 人时(3 人 × 10 天 × 4 小时/天)。WBS 任务拆分得非常细碎(例如多个 4 小时任务),这表明缓冲空间极小,“应急缓冲”仅占 10% (12h)。
-
关键人物依赖: 负责人彭怀玉是项目成功的最大瓶颈。他不仅担任“负责人/Scrum Master”,还同时是“M3 系统联调与验证”和“M4 项目管理与文档”的负责人,并且需要协作 M1 和 M2。他一人承担了管理、推进、集成、测试、文档的全部责任。一旦彭怀玉的进度受阻,整个 Alpha 计划(D0 至 D10) 将面临停滞。
|