我们为什么需要另一个“桌面助手”?
一、起点:从手动查找到一键问答
开发初期,我只是想解决自己的一个高频痛点:
在写代码、看PDF、甚至答题时,经常需要复制一段文本 → 打开浏览器 → 打开AI对话页 → 粘贴 → 等待回复 → 再切回原窗口。
这个过程重复、低效,且打断心流。
于是,第一个版本诞生了:
一个简单的窗口程序,内置大模型调用,支持本地文档加载。
它解决了基础问答问题,但依然需要“主动打开软件、切换窗口”。

二、迭代思路:从“工具”到“伙伴”的进化路径
1. V1:本地化 + 多文档支持
-
支持Word、PDF直接导入,构建个人知识库。
-
大模型接口可配置,适应不同模型供应商。
-
但交互方式仍是“你问我答”,属于被动工具。
2. V2:场景化答题 + 快捷键提问
-
加入“答题模式”,可绑定在线答题界面,实现实时查题。
-
快捷键
Alt+Q支持快速框选文本并提问,减少窗口切换。 -
开始尝试“无缝嵌入用户当前操作”。
3. V3:笔记整合 + 提示词自定义
-
支持选中内容一键保存到笔记,构建个人答题库。
-
开放系统提示词自定义,让工具可变为“翻译官”“代码助手”“文案生成器”等。
-
工具开始具备“身份切换”能力,更像一个可塑形的智能伙伴。
![image]()
三、终极形态:鹰眼模式——在任何界面,随时提问
这是我最想分享的部分,也是QA-Assistant的核心设计理念。
设计目标:
让大模型像“空气”一样无处不在,却又不必占据你的屏幕。
实现方式:
-
开启鹰眼模式后,软件缩小为一个始终置顶的迷你应答框。
-
无论你在浏览器、IDE、PDF阅读器、甚至图片中——
-
按下
Alt+Q,框选任意区域(支持截图OCR识别),问题即刻传入,答案即时返回。
为什么这是“终极交互”?
-
你不再需要“打开某个软件”。
-
你不再需要“复制粘贴”。
-
你甚至不需要“离开当前窗口”。
-
大模型成了你电脑系统层级的“隐形助手”。
![鹰眼模式15s]()
-
四、技术实现中的几个关键点
-
全局快捷键监听:确保在任何焦点下都能触发提问。
-
屏幕截图与OCR集成:支持图片中的文字提取,扩展使用场景。
-
多模型接口统一封装:兼容不同API格式,预留配置空间。
-
本地存储与隐私保护:所有文档、笔记不离本地,适合敏感资料场景。
五、未来方向:更轻、更智能、更插件化
-
计划支持“语音提问”与“语音播报回答”。
-
考虑开放插件系统,让开发者自定义功能模块。
-
尝试集成本地化小模型,实现完全离线的轻量问答。
六、写给同样在开发工具的你
如果你也在做一个“提升效率”的桌面工具,我的建议是:
不要一开始就追求功能全面,而是抓住一个核心痛点,把它做到“无需思考即可使用”。
交互的极致,往往是让用户感受不到“交互”的存在。
七、体验与交流
如果你对这款工具的开发思路感兴趣,或者也想尝试构建自己的“场景化AI助手”,欢迎下载体验:产品使用指南。
我们不是在做一个工具,而是在设计一种更自然的交互方式。
让AI不再是一个需要“打开”的软件,而是随时待命的“第二大脑”。
这就是QA-Assistant的故事,也是我作为一个开发者的坚持。
欢迎下载体验:产品使用指南。(闲鱼搜索:问答助手)


浙公网安备 33010602011771号