技术实现(第二部分):全自动案卷创建与智能文档处理
从注册检索到最终的 Actaport 案卷:XJustiz 解析、去重逻辑与 ZIP 处理

- 通过 Webhook 启动:表单触发器如何控制整个委托创建。
- 智能链接:n8n 如何检查、创建联系人并自动分配给新案卷。
- 文档流水线:自动下载、解压 (ZIP/PDF) 并直接存储在 Actaport 案卷中。
在我们系列的第一部分中,我们描述了为什么选择 Apify、n8n 和 Actaport 的云原生架构。反响热烈——许多同行都在问:“具体是怎么实现的?”
这第二部分描述了数据流水线的技术实现。我们不仅展示了如何导入主数据,还更进一步:全自动创建一个案卷,包括所有参与者的链接以及对从商业登记处自动检索到的登记文档的正确归档。
第一步:通过表单触发器进行数据采集
自动化的起点是一个 n8n Form Trigger。这使得数据输入与实际处理逻辑相分离。
表单仅采集 API 检索所需的参数:
- 地方法院 (Amtsgericht): 通过下拉菜单进行标准化选择。
- 注册号: 数字输入。
- 办案人员: 为随后的 Actaport 任务分配指定人员。
- 创建案卷: 布尔值(复选框)。如果勾选此项,流程将不会停留在联系人阶段,而是创建关联案卷。
提交表单后,数据被传递给一个 HTTP 请求,该请求通过 Webhook 启动主工作流。
视频:n8n Form Trigger —— 登记检索的数据采集。
第二步:处理登记数据 (XJustiz)
爬虫提供的数据为符合 XJustiz 标准的 XML。为了在 Actaport API 中进一步处理,需要进行转换,因为像法律形式代码 221110 这样的原始值不能被直接解读。
处理过程在 n8n 的一个 JavaScript Code-Node 中进行,它实现了两个核心功能:
- 解析 (Parsing): 迭代 XML 树结构(例如
tns:basisdatenRegister)以提取注册资本、公司经营范围和地址数据。 - 映射 (Mapping): 将 XJustiz 代码与内部映射表进行对比。例如,代码
111000会被翻译为字符串 "OHG",以满足 Actaport 数据模型的要求。
图:从原始 XML 通过 n8n 代码节点(映射)到清理后的 JSON 负载。
第三步:创建联系人并避免重复
每个案卷的基础是干净的联系人数据。为了避免冗余,工作流在每次创建前都会检查该人员或公司是否已存在。
该流程遵循以下模式:
- API 查询 (GET): 在 Actaport 存量中搜索现有条目(按名称和地点过滤)。
- 条件逻辑 (IF-Node):
- 情况 A(找到记录): 提取现有联系人的 ID。
- 情况 B(未匹配): 通过 POST 请求创建新联系人;返回新生成的 ID。
- 数据规范化: 无论走哪条路径,有效的
kontakt_id都会存储在一个统一的变量中。
在 Actaport 中创建或更新的联系人。
第四步:自动案卷创建
这是该扩展的真正价值所在:如果激活了“创建案卷”复选框,工作流将利用此前确定的 kontakt_id 来创建新案卷。
工作流通过 Actaport API (POST /v1/akten) 执行以下操作:
- 分配: 将公司(通过其 ID 识别)作为“委托人”与新案卷链接。
- 元数据: 案卷自动获得名称(例如 "HR-Import: [公司名称]")、标签和在表单中选择的办案人员。
- 返回值: API 返回新的案卷号(例如 "123/24"),这对于下一步至关重要。
第五步:文档检索与存入案卷
空案卷几乎没有帮助。因此,工作流在最后一步下载相关的登记文档(登记摘录、股东名录、公司章程)并直接存入新创建案卷的文档区。
在此过程中,n8n 解决了商业登记处的一个技术问题:文件格式不一致。
- MIME 类型检查: 一个 IF 节点分析文件是以 PDF 还是 ZIP 形式提供的。
- 解压 (Unzip): 自动解压 ZIP 压缩包以提取其中包含的 PDF。
- 上传: 通过端点
POST /v1/akten/{aktennummer}/dokumente将清理后的 PDF 直接上传到案卷的“Handelsregister”子文件夹中。
结果
流程结束时,会生成一个完整创建、可供处理的案卷。
完成的案卷:已链接委托人、分配了办案人员,所有文档均已归档。
办案人员最后会收到一封包含案卷链接和状态报告的确认电子邮件。这证明了现代 API 架构不仅能搬运数据,还能全自动化完成复杂的法律工作流程。
电子邮件确认:包括案卷创建在内的导入成功。
结论:从管理者到设计者
这次对我们“机房”的深入探究表明,如今的法律科技 (Legal Tech) 远不止是将纸质卷宗数字化。通过智能链接 API(Apify 和 Actaport)和流程逻辑 (n8n),我们几乎完全消除了公司法中一个行政时间杀手——委托创建。
收益不仅在于节省的时间(从小时缩短到秒),更在于质量:在公司/名称、地址或总经理分配上没有拼写错误,没有被遗忘的文档,且所有委托的数据结构保持一致。助理和律师从“数据录入员”变成了流程设计者,他们可以专注于其热爱的:法律咨询。