技术架构
一次截图,生成 Agent 可引用上下文。
NorthLight 不把截图直接塞进模型。它先保存现场证据,再补齐来源、抽取结构、建立索引, 最后按任务生成给 Agent 使用的 Context Bundle。
系统链路
主链路先看全局,再点开每段看输入、处理和产出。
核心原则很简单:证据先落地,补全可失败,派生结果可重算,Bundle 只在检索时生成。
设计原则
先保留可复核证据,再让模型和索引慢慢变聪明。
先落证据
补全可失败
派生可重算
检索时打包
01 / 触发
把快捷键变成统一事件入口。
消费什么用户动作、当前窗口、选区坐标、页面来源、时间和企业策略快照。
怎么处理统一包成 trigger envelope。后续管线只认这个 envelope,不绑定具体快捷键。
产出什么事件草稿 id、触发类型、来源线索和权限边界,供采集阶段继续补证据。
02 / 采集
先保存现场,不等待模型和外部系统。
消费什么选区截图、缩略图、坐标、窗口/URL、DOM、a11y、OCR 和一句用户用途。
怎么处理只做确定性采集和配对写入;外部 API、模型和复杂理解都放到异步阶段。
产出什么event draft、原始证据引用、来源 metadata、策略快照和可重试任务。
03 / 补全与去噪
补齐截图之外的来源,并判断真正目标。
消费什么事件草稿、选区坐标、来源线索、用户 intent、已保存证据和可用连接器权限。
怎么处理先用来源 API/DOM 补全;再用布局、重叠区域和 note 信号区分主目标、支撑上下文和噪声。
产出什么补全文本、结构化观察、实体、摘要、表格/图表抽取和 focus projection。
04 / 结构化入库
事实层和派生层分开存,方便复核和重算。
消费什么原始证据、补全结果、观察对象、实体、关系和每个抽取器的来源记录。
怎么处理事件账本只追加;摘要、实体、向量等派生数据带版本号,后续可以重算。
产出什么context events、artifact refs、observations、entities、relations 和 provenance。
05 / 建立索引
先过滤权限,再做关键词、语义和空间召回。
消费什么规范文本、实体、来源、时间、选区坐标、artifact 权限和脱敏状态。
怎么处理先用权限缩小候选,再并行做关键词、语义、实体、时间/来源和空间索引召回。
产出什么可解释候选:score、命中原因、证据引用、脱敏状态和是否可展开原文。
06 / Context Bundle
按任务生成最小必要上下文包。
消费什么用户问题、token 预算、权限范围、候选事件、证据引用和输出要求。
怎么处理把事实、片段、实体和引用压成任务输入;原图和完整 thread 默认不进入 Agent。
产出什么Context Bundle、引用列表、使用约束和 usage event,供 Agent 回答后复核。