技术架构

一次截图,生成 Agent 可引用上下文。

NorthLight 不把截图直接塞进模型。它先保存现场证据,再补齐来源、抽取结构、建立索引, 最后按任务生成给 Agent 使用的 Context Bundle。

系统链路

主链路先看全局,再点开每段看输入、处理和产出。

核心原则很简单:证据先落地,补全可失败,派生结果可重算,Bundle 只在检索时生成。

设计原则 先保留可复核证据,再让模型和索引慢慢变聪明。
先落证据 补全可失败 派生可重算 检索时打包

01 / 触发

把快捷键变成统一事件入口。

消费什么用户动作、当前窗口、选区坐标、页面来源、时间和企业策略快照。
怎么处理统一包成 trigger envelope。后续管线只认这个 envelope,不绑定具体快捷键。
产出什么事件草稿 id、触发类型、来源线索和权限边界,供采集阶段继续补证据。

02 / 采集

先保存现场,不等待模型和外部系统。

消费什么选区截图、缩略图、坐标、窗口/URL、DOM、a11y、OCR 和一句用户用途。
怎么处理只做确定性采集和配对写入;外部 API、模型和复杂理解都放到异步阶段。
产出什么event draft、原始证据引用、来源 metadata、策略快照和可重试任务。

03 / 补全与去噪

补齐截图之外的来源,并判断真正目标。

消费什么事件草稿、选区坐标、来源线索、用户 intent、已保存证据和可用连接器权限。
怎么处理先用来源 API/DOM 补全;再用布局、重叠区域和 note 信号区分主目标、支撑上下文和噪声。
产出什么补全文本、结构化观察、实体、摘要、表格/图表抽取和 focus projection。

04 / 结构化入库

事实层和派生层分开存,方便复核和重算。

消费什么原始证据、补全结果、观察对象、实体、关系和每个抽取器的来源记录。
怎么处理事件账本只追加;摘要、实体、向量等派生数据带版本号,后续可以重算。
产出什么context events、artifact refs、observations、entities、relations 和 provenance。

05 / 建立索引

先过滤权限,再做关键词、语义和空间召回。

消费什么规范文本、实体、来源、时间、选区坐标、artifact 权限和脱敏状态。
怎么处理先用权限缩小候选,再并行做关键词、语义、实体、时间/来源和空间索引召回。
产出什么可解释候选:score、命中原因、证据引用、脱敏状态和是否可展开原文。

06 / Context Bundle

按任务生成最小必要上下文包。

消费什么用户问题、token 预算、权限范围、候选事件、证据引用和输出要求。
怎么处理把事实、片段、实体和引用压成任务输入;原图和完整 thread 默认不进入 Agent。
产出什么Context Bundle、引用列表、使用约束和 usage event,供 Agent 回答后复核。