面向 AI Agent 的企业级知识工程平台
以本体为语义基座,将企业系统数据、业务文档与 API 能力沉淀为可治理、可追溯的知识资产,向上提供融合检索、规则推理与受控工具调用,支撑 Agent 在生产环境中安全、可审计地完成业务闭环。
能力雷达
实时活动流
live采集 · 检索 · Agent 7×24 节奏
组件健康
- ● PostgreSQL
- ● Redis
- ● Kafka
- ● MinIO
- ● OpenSearch
- ● Jena Fuseki
- ● HugeGraph
- ● Temporal
- ● Airflow
- ● OpenRAG
本体 · 映射 · 知识库
- customer360 v1.3
- contract_review v2.1
- equipment_diag v0.9-rc
- supplier_risk v1.0
- compliance_qa v1.1
- operation_copilot draft
今日 Agent 高风险动作
- L4 冻结供应商 SUP-009
- L3 提交合同审批 #C-2031
- L3 修改付款条件 P-441
- L3 创建维修工单 W-7741
- L4 修改用户角色 U-998
本体管语义,图谱管事实,RAG 管证据。
分层架构与三条横向控制面(语义 · 治理 · 运维)的可视化拆解,便于客户与实施团队对齐。
核心理念
# 平台分工 Ontology → 管语义 Knowledge Graph → 管事实 RAG → 管证据 Rules → 管判断 LLM → 管理解 / 表达 Agent → 管编排 / 执行 Governance → 管边界 / 审计 Ops → 管私有化运行
建设原则
- 不全量克隆源系统,构建 知识视图
- 抽取结果默认 候选知识,需审核发布
- Agent 不直访 底层数据库
- 所有工具调用经 Policy Gateway
- 高风险业务动作 必须人工确认
- 多引擎存储须 统一 ID
- 权限过滤必须 发生在检索阶段
- 评测、反馈、运营是平台 持续演进核心
分阶段交付
把企业每一座 数据孤岛,变成可被治理的入口。
统一接入 ERP / CRM / MES / PLM / OA / DMS / 消息流 / 业务 API / 知识库系统,覆盖国产数据库与国产业务系统。
数据源列表
| 名称 | 类型 | 所属系统 | 同步模式 | 权限 | 负责人 | 状态 | 更新 |
|---|---|---|---|---|---|---|---|
| CRM 客户库 crm_mysql | MySQL | CRM | CDC | 继承 | 赵云鹏 | ●运行 | 2 min |
| ERP 订单库 erp_oracle | Oracle | ERP | CDC | 继承 | 张瑾 | ●运行 | 38 s |
| MES 生产库 mes_pg | PostgreSQL | MES | CDC | 继承 | 王柏栎 | ●运行 | 12 s |
| PLM BOM 库 plm_dameng | 达梦 | PLM | 批量 | RBAC | 李莎 | ●运行 | 4 h |
| HR 人员库 hr_kingbase | 人大金仓 | HR | 批量 | 部门隔离 | 陈嘉澍 | ●运行 | 22 m |
| 合同 DMS dms_minio | MinIO | DMS | 事件 | 密级 + ACL | 柳衍 | ●运行 | 8 m |
| OA 流程消息 oa_kafka | Kafka | OA | 流式 | 继承 | 段元琛 | ●降级 | 68 s |
| SRM 供应商 API srm_api | REST | SRM | 定时 | RBAC | 方与时 | ●运行 | 15 m |
| EAM 设备库 eam_oracle | Oracle | EAM | CDC | 继承 | 魏珩 | ●失败 | 1 h |
| 语雀知识库 yuque_api | 知识库 | 研发中心 | 事件 | 空间 ACL | 苏迟 | ●运行 | 45 s |
| 泛微 OA 附件 weaver_sftp | SFTP | 泛微 | 批量 | 密级 | 邱迎 | ●运行 | 2 h |
| 财务数据仓 dw_doris | Doris | 财务 | 定时 | 分级 | 谢九思 | ●运行 | 30 m |
连接器能力矩阵
- 关系数据库 MySQLOracle达梦人大金仓openGauss
- 数据仓 DorisHiveCKStarRocks
- API 系统 ERPCRMMESPLM
- 文档 NASFTPSFTPMinIODMS
- 消息 KafkaPulsarRabbitMQ
- 搜索 ESOpenSearch
- 知识库 Confluence语雀Wiki
- 国产业务 泛微致远金蝶用友
testConnection() // 连通性 discoverMetadata() // 元数据扫描 previewData() // 预览样例 readBatch() readIncremental() readCDC() fetchPermissions() // 权限血缘 fetchSchema() fetchDocuments() fetchChanges()
数据源配置 · 示例
{
"source_id": "crm_mysql",
"source_name": "CRM 客户库",
"source_type": "mysql",
"tenant_id": "tenant_001",
"connection_config": {
"host": "10.0.0.1",
"port": 3306,
"database": "crm",
"username": "readonly_user",
"password_ref": "kms://secret/crm_mysql"
},
"owner": "sales_department",
"sync_mode": "cdc",
"permission_mode": "inherit",
"enabled": true
}
同步任务 · 实时
让数据自己 开口介绍自己。
自动扫描表 / 字段 / 文档 / API,输出空值率、唯一率、枚举、样例、潜在实体、潜在关系,作为本体映射的最佳起点。
对象 · crm_customer
- 类型
- table
- 行数
- 120,341
- 主键
- customer_id
- 外键
- industry_code → industry.code
- 更新字段
- updated_at
- 负责人
- sales_department
- 密级
- L2 · 内部
- ● Customer
- ● Organization
- ● Account
- Customer-belongsTo-Industry
- Customer-signs-Contract
- Customer-owns-Equipment
字段画像 · crm_customer
| 字段 | 类型 | 空值率 | 唯一率 | 样例 | 语义候选 |
|---|---|---|---|---|---|
| customer_id | bigint | 0.0% | 100% | 3401, 3402… | Customer.id |
| customer_name | varchar(120) | 0.6% | 87% | 华东设备 / 启明医疗 / … | Customer.name 高置信 |
| industry_code | varchar(8) | 2.1% | 3.4% | MNF / FIN / GOV | Customer.industry → enum |
| level | char(1) | 1.4% | 0.003% | A / B / C | Customer.level enum |
| credit_limit | decimal(14,2) | 4.2% | 92% | 1,000,000.00 | Customer.creditLimit |
| data_scope | varchar(64) | 0.9% | 5.7% | region:east, dept:sales | 权限标签 |
| created_at | datetime | 0.0% | — | 2024-04-21 09:21:38 | Customer.createdAt |
| updated_at | datetime | 0.0% | — | 2026-05-18 15:22:08 | 增量水位 |
文档发现 · 合同库
- 📄 采购合同模板_v3.pdf
- 📄 服务合同_GS-2025.docx
- 📄 框架协议_供应商A.pdf
- 📄 维修合同标准条款.docx
- 📄 NDA 通用模板.pdf
API 发现 · CRM REST
| 方法 | 路径 | 含义 | 风险 |
|---|---|---|---|
| GET | /customers/{id} | 查询客户 | L1 |
| GET | /customers/{id}/credit | 查询信用 | L1 |
| POST | /leads | 新建商机 | L2 |
| POST | /follow-ups | 创建跟进 | L2 |
| PUT | /customers/{id}/credit | 修改信用 | L4 |
| POST | /contracts/{id}/submit | 提交合同审批 | L3 |
| DELETE | /customers/{id} | 删除客户 | L4 |
用 语义 给企业搭一座共同语言。
三层本体 · 概念 · 关系 · 约束 · 词表 · 同义词 · 工具绑定 · 版本与影响分析。
本体树
Customer customer360.Customer
已发布 · v1.3- 父概念
- Organization · LegalEntity
- 命名空间
- https://atlas/onto/customer360#
- 同义词
- 客户 · 甲方 · Buyer · Account
- 用途
- 面向销售、合同、信用、运营场景的统一客户语义
- SHACL 约束
- 必填 name, industry · creditLimit ≥ 0 · level ∈ {Strategic,Key,Normal}
- 权限标签
- data_scope · region · dept
- 工具绑定
- get_customer_credit · create_follow_up · submit_contract
| 属性 | 类型 | 必填 | 枚举 | 来源 |
|---|---|---|---|---|
| id | xsd:string | 是 | — | CRM.customer_id |
| name | xsd:string | 是 | — | CRM / ERP |
| industry | Industry | 是 | 词表 | CRM.industry_code |
| level | CustomerLevel | 否 | Strategic/Key/Normal | CRM.level |
| creditLimit | xsd:decimal | 否 | — | ERP.credit_limit |
| region | xsd:string | 否 | 词表 | CRM.region |
| 关系 | Domain | Range | 基数 | 逆关系 |
|---|---|---|---|---|
| belongsTo | Customer | Industry | 1..1 | — |
| signs | Customer | Contract | 0..* | signedBy |
| owns | Customer | Equipment | 0..* | ownedBy |
| places | Customer | Order | 0..* | placedBy |
| servedBy | Customer | SalesRep | 1..* | serves |
词表 · CustomerLevel
- Strategic
- Key
- Normal
- Inactive
- v1.3 当前
- v1.2
- v1.1
- v1.0
RDF / Turtle 片段
@prefix customer360: <https://atlas/onto/customer360#> . @prefix sh: <http://www.w3.org/ns/shacl#> . customer360:Customer a owl:Class ; rdfs:subClassOf customer360:LegalEntity ; rdfs:label "客户"@zh, "Customer"@en ; customer360:hasVocabulary customer360:CustomerLevel . customer360:CustomerShape a sh:NodeShape ; sh:targetClass customer360:Customer ; sh:property [ sh:path customer360:name ; sh:minCount 1 ] ; sh:property [ sh:path customer360:level ; sh:in ( "Strategic" "Key" "Normal" ) ] .
同义词与术语
| 术语 | 规范名 | 语种 | 来源 |
|---|---|---|---|
| 甲方 | Customer | zh | 合同模板 |
| 大客户 | Strategic Customer | zh | 销售制度 |
| 买方 | Customer | zh | 采购语境 |
| Account | Customer | en | CRM 文档 |
| Buyer | Customer | en | 合同英文版 |
| 客方 | Customer | zh | 电信用语 |
把字段、文档、API 翻译 成本体的语言。
规则映射 + 词表 + 字段名相似度 + 样例值分析 + LLM 推荐 + 人工确认 + 模板复用。
映射列表
| 名称 | 源 | 目标 | 本体版本 | 状态 | 更新 |
|---|---|---|---|---|---|
| crm_customer → Customer | crm_mysql.crm_customer | Customer | v1.3 | 已发布 | 2 d |
| erp_order → Order | erp_oracle.t_order | Order | v1.3 | 已发布 | 3 d |
| mes_workorder → WorkOrder | mes_pg.workorder | WorkOrder | v1.2 | 草稿 | 11 m |
| plm_bom → BOM | plm_dameng.bom | BOM | v1.0 | 已发布 | 1 w |
| dms_contract → Contract | dms_minio:/contracts | Contract | v2.1 | 已发布 | 5 h |
| eam_equipment → Equipment | eam_oracle.t_eq | Equipment | v0.9 | 校验中 | 22 m |
| hr_employee → Person | hr_kingbase.employee | Person | v1.1 | 已发布 | 2 w |
| oa_request → Process | oa_kafka:/oa-events | Process | v1.0 | 已发布 | 9 h |
映射 · crm_customer_mapping_v1
mapping_id: crm_customer_mapping_v1 source: type: database source_id: crm_mysql table: crm_customer ontology: version: customer360_v1.3 target: concept: Customer identity: source_id_field: customer_id entity_id_rule: "Customer:${customer_id}" fields: customer_name: property: Customer.name transform: trim required: true customer_level: property: Customer.level enum_mapping: A: Strategic B: Key C: Normal industry_code: property: Customer.industry lookup: industry_dictionary relations: - type: Customer-belongsTo-Industry source_field: industry_code target_lookup: Industry.code metadata: source_system: CRM permission_field: data_scope
推荐准确率
影响分析 · 草稿映射
- 新增字段 operator_id → Person
- 修改 status 枚举
- 波及实体抽取 WorkOrder
- 波及规则 downtime_high_risk
- 影响工具 create_work_order
映射模板库
- 合同标准条款 → Clause
- 设备工单 → WorkOrder
- 人员组织 → Person
- 采购订单 → PurchaseOrder
- 财务凭证 → Voucher
从 原始数据 到可发布知识的全过程。
结构化数据、文档、API 三类流水线,统一状态机:Raw → Parsed → Mapped → Extracted → Linked → Validated → Reviewed → Published → Indexed。
统一状态机
结构化数据流水线
读取源表 → 字段清洗 → 映射到 Entity / Event / Relation → 实体 ID 生成 → 实体对齐 → 关系构建 → SHACL / Rule 校验 → 写入候选知识池 → 审核 / 自动发布 → 写入 RDF / Graph / Search
文档数据流水线
文件发现 → 权限继承 → 原文入 MinIO → Docling / Tika / OCR 解析 → 章节结构识别 → Chunk 切分 → 元数据提取 → OpenRAG 文档索引 → 实体识别与链接 → Embedding → Evidence 生成 → 审核 / 发布
运行视图 · 近 12 小时
不同系统里的「同一家客户」,归并 为一份事实。
主键 / 统一社会信用代码 / 设备编号 / 合同编号 / 名称 / 别名 / 向量 / 邻域 / 人审,多策略融合。
候选合并 · Customer
| 主体 | 来源 | 策略 | 置信 | 动作 |
|---|---|---|---|---|
| 华东设备有限公司 CRM C001 ↔ ERP ERP-C-9981 | CRM / ERP | 名称 + 信用代码 | 0.96 | 建议合并 |
| 启明医疗股份有限公司 CRM C088 ↔ DMS Vendor-77 | CRM / DMS | 名称 + 别名 | 0.92 | 建议合并 |
| 北方矿业(旧) CRM C112 ↔ ERP ERP-C-3301 | CRM / ERP | 历史名称 | 0.83 | 人审 |
| 江南智造 SRM S-441 ↔ CRM C300 | SRM / CRM | 统一社会信用代码 | 0.99 | 建议合并 |
| 上海某公司 CRM C401 ↔ ERP ERP-C-7780 | CRM / ERP | 向量 + 邻域 | 0.71 | 不建议 |
| 联诚精密 CRM C551 ↔ DMS Vendor-118 | CRM / DMS | 缩写匹配 | 0.78 | 人审 |
主实体 · Customer:000123
- 规范名
- 华东设备有限公司
- 别名
- 华东设备 · 华东设备有限责任公司
- 统一信用代码
- 91320200H88126XY
- 所属行业
- 制造业 · 通用设备
- 等级
- Strategic · A
- 信用额度
- ¥ 12,000,000
- 置信度
- 0.96
- 审核状态
- approved
{
"entity_id": "Customer:000123",
"source_records": [
{ "source_system": "CRM", "source_id": "C001" },
{ "source_system": "ERP", "source_id": "ERP-C-9981" },
{ "source_system": "DMS", "source_id": "Vendor-77" }
],
"confidence": 0.96,
"review_status": "approved"
}
抽取结果默认是 候选,发布权握在人手里。
候选实体 · 关系 · 事件 · 规则 · 文档标签 · 实体链接 · 映射 · 工具契约 —— 高置信度 + 低风险自动发布,敏感与高风险必须人审。
| 类型 | 对象 | 来源 | 置信 | 风险 | 触发审核 | 建议 |
|---|---|---|---|---|---|---|
| 实体 | Customer:000456 启明医疗 | CRM + DMS | 0.97 | L0 | — | 自动发布 |
| 关系 | Equipment:A → hasFault → FaultEvent #38 | EAM + 工单 | 0.94 | L0 | — | 自动发布 |
| 实体 | Customer:000789 北方矿业 | CRM | 0.78 | L1 | 低置信 | 人审 |
| 规则 | 合同金额 > 500 万 → 法务复审 | 制度文档 | 0.82 | L3 | 影响 Agent 工具 | 必审 |
| Tool | create_work_order · v2 | EAM OpenAPI | 0.90 | L3 | 写操作 + 高风险 | 必审 |
| 事件 | 停机超过 30 分钟 = 高风险事件 | 制度 | 0.88 | L1 | SHACL 触发 | 人审 |
| 关系 | Customer C112 ↔ ERP-C-3301 | 历史名称 | 0.83 | L1 | 低置信 | 人审 |
| 实体 | Risky Customer 银影集团 | 新闻 | 0.62 | L4 | 权限不明 | 阻断 |
把企业事实,编织 成一张可被推理的网。
HugeGraph 属性图 · Apache Jena RDF · 多跳遍历 · SPARQL · 图分析 · 与 OpenSearch 联动检索。
子图视图 · Customer:华东设备 (3-hop)
SPARQL · 多跳查询
PREFIX c360: <https://atlas/onto/customer360#> PREFIX rdf: <http://www.w3.org/1999/02/22-rdf-syntax-ns#> SELECT ?eq ?fault ?wo WHERE { ?cust rdf:type c360:Customer ; c360:owns ?eq . ?eq c360:hasFault ?fault . ?fault c360:triggers ?wo . FILTER regex(str(?cust), "华东设备") } LIMIT 50
- 实体节点 2,418,902
- 关系边 9,742,118
- 三元组 21.4 M
- SPARQL 平均耗时 180 ms
- Gremlin 平均耗时 96 ms
实体类型分布
- Customer 241,029
- Contract 418,777
- Equipment 96,241
- Order 1,221,011
- WorkOrder 308,440
- Document 4,222,118
关系类型分布
- signs 418k
- belongsTo 241k
- owns 96k
- places 1.22M
- hasFault 38k
- triggers 21k
- cites 1.4M
图分析任务
- Customer 360 邻域聚合
- 供应商风险传导
- 合同 — 设备 — 工单关联
- 组织树同步
- 影响传播评估
OpenRAG 是基座,不是终点。
Langflow + OpenSearch + Docling 提供文档摄取 / 解析 / 索引 / 检索基础能力,平台通过 OpenRAG Adapter 屏蔽内部实现并做企业化封装。
知识库列表
| 知识库 | 领域 | 文档 | Chunks | 本体 | 密级 | 状态 |
|---|---|---|---|---|---|---|
| 合同知识库 kb_contract_001 | Legal | 14,221 | 1.8M | contract_review v2.1 | L3 | ●OK |
| 设备维修手册 kb_equip_001 | Manufacturing | 3,402 | 620k | equipment_diag v0.9 | L2 | ●OK |
| 客户 360 资料 kb_cust360_001 | Sales | 22,108 | 3.2M | customer360 v1.3 | L2 | ●OK |
| 采购制度库 kb_proc_001 | Compliance | 881 | 121k | compliance_qa v1.1 | L3 | ●OK |
| 研发知识库 (语雀) kb_rd_001 | R&D | 9,440 | 1.4M | customer360 v1.3 | L2 | ●重建中 |
| 财务凭证 kb_fin_001 | Finance | 32,118 | 5.1M | compliance_qa v1.1 | L4 | ●OK |
OpenRAG Adapter · 契约
POST /openrag/kbs // 知识库 GET /openrag/kbs/{kb_id} DEL /openrag/kbs/{kb_id} POST /openrag/documents/ingest // 文档 POST /openrag/documents/{id}/reindex DEL /openrag/documents/{id} POST /openrag/retrieve // 检索 POST /openrag/flows/{name} // Langflow GET /openrag/citations/{cid} GET /openrag/health
- 统一租户标识 + 知识库与本体版本绑定
- 文档权限标签传递 / 来源 / 血缘字段
- Chunk 与 Entity 关联 + Evidence Registry
- OpenSearch 索引命名规范
- 企业统一认证 / 审计 / 监控
- 删除传播 / 权限变更后索引更新
- 降级模式:仅 OpenSearch 关键词 + 向量
解析能力
- PDF / Word / Excel / PPT
- 表格抽取 (Docling)
- 图像 OCR (PaddleOCR)
- 章节结构识别
- 公式 / 代码块识别
- Markdown / HTML
检索策略
- 全文 BM25
- 向量 cosine (bge-m3)
- 混合 fusion (rrf)
- Rerank (bge-reranker)
- Chunk → Document 聚合
- 权限过滤前置
OpenRAG 关键指标
- 解析耗时 P95 4.8s
- 索引耗时 P95 1.2s
- 检索 P95 820ms
- Langflow Flow 平均 2.1s
- Docling 失败率 0.7%
知识对象都有 来历、版本与去向。
统一管理 SourceSystem / Ontology / Mapping / Entity / Document / Chunk / Evidence / Rule / Tool 的元数据、血缘与索引位置。
核心对象
血缘 · Customer:000123
统一 ID 规范
| 对象 | ID 格式 | 示例 |
|---|---|---|
| 数据源 | {source_id} | crm_mysql |
| 源对象 | {source_id}.{schema}.{name} | crm_mysql.crm.crm_customer |
| 本体概念 | {ontology_ns}#{Concept} | customer360#Customer |
| 实体 | {Concept}:{stable_id} | Customer:000123 |
| 关系 | rel_{uuid} | rel_8a23ff… |
| 文档 | doc_{uuid} | doc_44e1… |
| Chunk | {doc_id}#chunk_{n} | doc_44e1#chunk_009 |
| 证据 | evd_{uuid} | evd_77b… |
| 流水线 | run_{uuid} | run_001 |
| Agent 执行 | trace_{uuid} | trace_4188 |
文档 + 图谱 + 规则,融合 出可信回答。
意图识别 → 本体扩展 → 实体链接 → 文档检索 + 图谱检索 + 规则查询 → 证据融合 → Rerank → LLM 生成 → 引用 + 推理链。
设备 A 近 30 天共发生 5 次非计划停机,主要原因有两类:(1)压力传感器异常导致触发 PLC 紧急停机1;(2)历史维修不彻底,上次更换轴承未做动平衡,振动逐步累积2。运维记录显示停机集中在每日上午高负载时段3。
合同侧,与设备 A 关联的 《采购合同模板 v3》第 8.3 条「可用率」 约定 年度可用率不得低于 95%4;同合同 第 12.1 条「不可抗力」 不包含传感器自然失效5。结合制度规则 RULE-DOWNTIME-30(停机超过 30 分钟即为高风险事件)6,建议立即触发:
- 创建 维修工单 W-7741(待人审);
- 启动 替换备件采购 流程;
- 向客户 华东设备 发送可用率说明初稿。
Evidence
检索策略
- Vector First
- Keyword First
- Graph First
- Ontology First
- Parallel Fusion
- Reasoning Loop
API 请求
{
"query": "设备A最近为什么频繁停机?",
"tenant_id": "tenant_001",
"strategy": "parallel_fusion",
"options": {
"use_openrag": true,
"use_graph": true,
"use_rules": true,
"use_ontology_expand": true,
"top_k": 10,
"rerank": true
}
}
关键指标
- P95 查询耗时 4.2s
- 引用准确率 0.94
- 幻觉率 2.3%
- 图谱证据覆盖率 0.81
- 多跳命中率 0.78
- 越权拦截率 100%
统一对外的 知识 API,业务系统不直访底层。
所有 API 鉴权 / 审计 / 权限过滤 / 来源回写;对 Agent 暴露的能力必须在 Tool Registry 注册。
服务目录
| 服务 | 路径前缀 | 能力 | QPS |
|---|---|---|---|
| Ontology API | /onto | 概念/属性/约束 | 120 |
| Entity API | /entities | 查询/邻域/合并 | 610 |
| Relation API | /relations | 关系增删查 | 240 |
| Document API | /docs | 文档元数据 | 180 |
| Chunk API | /chunks | 段落访问 | 420 |
| Evidence API | /evidence | 引用/证据链 | 910 |
| Graph Query | /graph | Gremlin 子图 | 148 |
| SPARQL | /sparql | RDF 查询 | 80 |
| GraphRAG | /graphrag | 融合检索 | 72 |
| Reasoning | /reasoning | 规则推理 | 34 |
| Provenance | /provenance | 血缘/溯源 | 62 |
| Feedback | /feedback | 反馈采集 | 18 |
| Tool | /tools | 工具调用 | 208 |
设计原则
- 不直接暴露底层数据库
- 不让业务系统直访 Jena / HugeGraph / OpenSearch
- 所有 API 必须鉴权 · 必须审计
- 敏感数据必须脱敏
- 检索结果必须做权限过滤
- 对 Agent 暴露的 API 必须注册为 Tool
- 所有返回结果应包含 来源 + 证据
- 幂等 / 限流 / 配额 / 灰度
调用样例 · /entities/neighbors
GET /entities/Customer:000123/neighbors ?depth=2 &types=Contract,Equipment // 200 OK { "entity_id": "Customer:000123", "neighbors": [ { "id":"Contract:CT-2025-049", "rel":"signs" }, { "id":"Equipment:A", "rel":"owns" }, { "id":"FaultEvent:#38", "rel":"owns→hasFault" } ], "permission_filtered": true, "provenance_ref": "prov:Customer:000123@v3" }
把企业 判断标准,从口口相传变成可执行规则。
质量规则 · 业务规则 · 风险规则 · 合规规则 · Agent 规则 · 权限规则 —— SHACL / Drools / DMN / OPA / Casbin / GE 多引擎支持。
规则列表
| 规则 ID | 名称 | 类型 | 引擎 | 状态 | 命中 24h |
|---|---|---|---|---|---|
| RULE-DOWNTIME-30 | 停机超 30 分钟为高风险事件 | 业务 | DMN | 已发布 | 14 |
| RULE-CONTRACT-AVAIL-95 | 设备年可用率 ≥ 95% | 合规 | DMN | 已发布 | 2 |
| RULE-CONTRACT-500W | 合同金额 > 500 万 必须法务复审 | 合规 | Drools | 已发布 | 4 |
| RULE-SUPPLIER-OBSV | 供应商准交率 < 90% 进入观察名单 | 风险 | Drools | 已发布 | 11 |
| RULE-EQ-DEPT | 设备必须有关联部门 | 质量 | SHACL | 已发布 | 320 |
| RULE-PERM-CONTRACT | 仅法务可访问合同密级文档 | 权限 | OPA | 已发布 | 1,418 |
| RULE-AGENT-HIGH | 高风险工具必须人工确认 | Agent | OPA | 已发布 | 38 |
| RULE-DQ-NULL | 客户名称不允许为空 | 质量 | GE | 已发布 | — |
规则定义 · DMN
// Decision Table inputs: contract.amount :: number contract.party :: string outputs: required_review :: bool reviewer_role :: string rules: - amount > 5_000_000 → required_review = true, reviewer_role = "legal" - amount > 1_000_000 → required_review = true, reviewer_role = "finance" - otherwise → required_review = false
SHACL · 数据约束
customer360:CustomerShape a sh:NodeShape ;
sh:targetClass customer360:Customer ;
sh:property [
sh:path customer360:name ;
sh:minCount 1 ;
sh:message "客户名称不能为空" ;
] ;
sh:property [
sh:path customer360:level ;
sh:in ( "Strategic" "Key" "Normal" ) ;
] .
把业务系统的能力,抽象 成可治理的工具目录。
注册业务能力的输入 / 输出 / 前置 / 后置 / 风险 / 鉴权 / 调用方式 / 是否人审 / 是否可回滚。
业务能力目录
| 业务能力 | 所属系统 | 类型 | 前置 | 后置影响 | 风险 | 策略 |
|---|---|---|---|---|---|---|
| 查询客户信用 | ERP / CRM | 只读 | 角色 sales | — | L1 | 自动执行 |
| 查询设备状态 | EAM / MES | 只读 | 角色 maint | — | L1 | 自动执行 |
| 创建客户跟进 | CRM | 写入 | 角色 sales | 新增 follow_up 行 | L2 | 用户确认 |
| 创建维修工单 | EAM | 写入 | 角色 maint | 新增 work_order · 通知 | L3 | 必须人审 |
| 提交合同审批 | OA | 流程 | 合同已上传 | 启动 BPM 流 | L3 | 必须人审 |
| 修改付款条件 | ERP | 高风险 | 角色 finance + 二人 | 影响应付账款 | L4 | 仅生成建议 |
| 冻结供应商 | ERP / SRM | 高风险 | 合规审批 | 影响采购订单 | L4 | 禁止自动执行 |
| 修改用户角色 | IAM | 高风险 | 双人审批 | 权限变更 | L4 | 禁止自动执行 |
| 导出客户清单 | CRM | 读出 | 角色 sales-ops | — | L2 | 用户确认 + 水印 |
Agent 调用的每一个工具,都得在登记簿里。
注册 / 鉴权 / 风险分级 / 人审 / 写操作 / 是否可回滚 / 审计级别 —— 所有工具调用必须经 Policy Gateway。
工具列表
| 工具 | 所属系统 | 等级 | 写 | 人审 | 回滚 | 调用 24h |
|---|---|---|---|---|---|---|
| get_customer_credit v1.2 · ERP | ERP | L1 | — | — | — | 1,488 |
| query_equipment_status v1.0 · EAM | EAM | L1 | — | — | — | 2,038 |
| get_contract_clauses v0.9 · DMS | DMS | L0 | — | — | — | 921 |
| create_follow_up v1.0 · CRM | CRM | L2 | ✔ | 用户确认 | ✔ | 312 |
| create_work_order v2.0 · EAM | EAM | L3 | ✔ | 必须人审 | ✔ | 21 |
| submit_contract_review v1.0 · OA | OA | L3 | ✔ | 必须人审 | — | 14 |
| update_payment_terms v1.0 · ERP | ERP | L4 | ✔ | 仅建议 | — | 0 |
| freeze_supplier v1.0 · SRM | SRM | L4 | ✔ | 禁止自动 | — | 0 |
| change_user_role v1.0 · IAM | IAM | L4 | ✔ | 禁止自动 | — | 0 |
Tool Contract · create_work_order
{
"tool_id": "create_work_order",
"tool_name": "创建设备维修工单",
"source_system": "EAM",
"input_concepts": [
"Equipment", "FaultEvent",
"MaintenanceAction"
],
"output_concepts": ["WorkOrder"],
"permission": "workorder:create",
"risk_level": "L3",
"human_confirm": true,
"write_operation": true,
"rollback": true,
"audit_level": "full",
"rate_limit": "60/min/user",
"timeout_ms": 8000
}
| 等级 | 类型 | 策略 |
|---|---|---|
| L0 | 知识查询 | 自动执行 |
| L1 | 只读业务查询 | 权限校验 |
| L2 | 低风险写 | 用户确认 |
| L3 | 高风险写 | 必须人审 |
| L4 | 财务 / 合同 / 权限 | 默认禁止自动 |
从用户一句话,到 可被回放 的业务动作。
意图识别 → 本体对齐 → 任务拆解 → GraphRAG/规则 → Tool 选择 → Policy Gateway → 人审 → 业务 API → 结果回写 → 审计。
执行链路 · trace_4188 · 设备 A 停机处理
等待人审create_work_order {
equipment_id: "Equipment:A",
fault_event_id: "FaultEvent:#38",
priority: "high",
reason: "压力传感器异常 + 历史维修不彻底",
evidence_refs: [
"doc_44e1#chunk_009",
"doc_44e1#chunk_017"
],
proposed_action: "更换压力传感器 + 动平衡测试"
}
Agent 列表
- ◆ 合同审查 Copilot
- ◆ 设备故障代理
- ◆ 客户 360 智询
- ◆ 供应商风险助手
- ◆ 合规问答
- ◆ 运维 Copilot
- ◆ 报告草稿生成
- 意图识别 / 概念对齐 / 任务规划
- GraphRAG / KG / Rule 调用
- 工具选择 / Policy 校验
- 人工确认 / 回退
- 失败重试 / 任务恢复
- 执行结果回写 + 审计
Agent 与知识服务的 守门员。
校验用户身份 / 角色 / 组织 / 数据权限 / 文档密级 / 工具权限 / 风险等级 / 是否人审 / 是否跨租户 / 是否写 / 是否敏感 / 频率。
Decision Log · 24h
| 时间 | 主体 | 动作 | 对象 | 命中策略 | 判定 |
|---|---|---|---|---|---|
| 15:21:08 | 林知雨 · maint | create_work_order | Equipment:A | RULE-AGENT-HIGH | 人审 |
| 15:18:42 | 赵云鹏 · sales | get_customer_credit | Customer:000123 | L1 · 角色 sales | 放行 |
| 15:14:01 | auto-agent · ops | freeze_supplier | Supplier:S-009 | L4 · 默认禁止 | 拦截 |
| 15:09:13 | 柳衍 · legal | get_contract_clauses | Contract:CT-2025-049 | RULE-PERM-CONTRACT | 放行 |
| 14:58:12 | 段元琛 · ops | get_contract_clauses | Contract:CT-2025-049 | 密级 L3 · 越权 | 拦截 |
| 14:50:37 | auto-agent · sales | create_follow_up | Customer:000088 | L2 · 用户确认 | 用户确认 |
| 14:48:11 | fin-bot · finance | update_payment_terms | P-441 | L4 · 仅建议 | 拦截 |
| 14:32:08 | 魏珩 · maint | query_equipment_status | Equipment:B | L1 | 放行 |
| 14:14:55 | 邱迎 · ops | change_user_role | User:U-998 | L4 · 双人审批未到位 | 拦截 |
策略 · OPA Rego
package atlas.tools default allow = false allow { input.tool.risk_level <= "L1" has_permission(input.user, input.tool.permission) } require_human_review { input.tool.risk_level == "L3" } else { input.tool.risk_level == "L4" input.tool.policy_override == true } deny["cross-tenant"] { input.tool.tenant_scope == "single" input.user.tenant != input.target.tenant } deny["sensitive-doc"] { input.target.security_level == "L4" not input.user.roles["legal"] }
IAM + RBAC + ABAC + 数据标签 + 密级 + 租户隔离。
多租户 / 用户 / 角色 / 组织 / 数据权限 / 文档 ACL / 字段脱敏 / 检索前过滤 + 服务层二次过滤。
租户
- 当前 tenant_001
- 在线 tenant_002
- 在线 tenant_003
- L0 公开
- L1 内部公开
- L2 内部受限
- L3 机密
- L4 绝密
角色
| 角色 | 用户 | 密级 |
|---|---|---|
| knowledge-admin | 3 | L4 |
| knowledge-architect | 5 | L3 |
| data-steward | 12 | L3 |
| legal | 9 | L4 |
| finance | 14 | L4 |
| sales | 62 | L2 |
| maint | 38 | L2 |
| ops | 22 | L1 |
| read-only | 53 | L1 |
数据权限策略
// 角色 sales 的客户访问 allow read entity:Customer where data_scope.region in user.regions and data_scope.dept == user.dept // 文档 ACL · 合同密级 allow read doc where doc.security_level <= user.clearance and doc.acl.contains(user.role) // 字段脱敏 mask field Customer.creditLimit if user.role not in (finance, legal)
- ① 检索 前置 过滤(OpenSearch query 注入)
- ② 服务层 二次 过滤(API gateway)
- ③ Agent 工具 调用前 (Policy Gateway)
- ④ 字段 脱敏 / 引用裁剪
- ⑤ 反馈与导出 水印
每一次知识 来历 与每一次动作 都有据可查。
数据源访问 / 同步任务 / 映射变更 / 本体变更 / 知识发布 / 文档检索 / GraphRAG / Agent 调用 / 权限变更 / 反馈 —— 全量审计。
审计日志 · 实时
| 时间 | 主体 | 类型 | 对象 | 结果 | 追踪 |
|---|---|---|---|---|---|
| 15:21:08 | 林知雨 | tool.call | create_work_order · W-7741 | 人审 | trace_4188 |
| 15:18:42 | 赵云鹏 | graphrag.query | 客户 360 · Customer:000123 | OK | qry_8821 |
| 15:14:01 | auto-agent | tool.call | freeze_supplier | 拦截 | trace_4187 |
| 15:09:13 | 柳衍 | doc.read | 采购合同模板 v3 | OK | audit_x91 |
| 14:58:12 | 段元琛 | doc.read | 合同 §8.3 | 越权 | audit_x90 |
| 14:48:11 | fin-bot | tool.call | update_payment_terms | 拦截 | trace_4185 |
| 14:30:04 | knowledge-admin | ontology.publish | customer360 v1.2 → v1.3 | OK | audit_x88 |
| 14:12:32 | data-steward | mapping.publish | crm_customer_v1 | OK | audit_x86 |
| 13:48:11 | knowledge-admin | perm.change | role:legal +tools[get_contract_clauses] | OK | audit_x82 |
| 13:21:01 | system | pipeline.run | contract_docs → openrag | OK | run_8821 |
Provenance · Customer:000123
{
"knowledge_object_id":
"Entity:Customer:000123",
"source_system": "CRM",
"source_object": "crm_customer",
"source_id": "C001",
"source_updated_at": "2026-05-18 10:00",
"ingested_at": "2026-05-18 10:05",
"pipeline_run_id": "run_8821",
"mapping_version":
"crm_customer_mapping_v1",
"ontology_version":
"customer360_v1.3",
"confidence": 0.96,
"review_status": "approved",
"reviewed_by": "data-steward-12",
"reviewed_at": "2026-05-18 10:12"
}
没有评测,就没有演进。
RAG / GraphRAG / 实体抽取 / Agent / 权限 / 成本 / 运维 —— 全维度评测,配套数据集与回归。
文档检索 · OpenRAG
RAG / GraphRAG 答案
Agent
评测任务历史
| 评测 | 类型 | 数据集 | 样本 | 主指标 | 对比 | 状态 |
|---|---|---|---|---|---|---|
| eval-218 | GraphRAG | contract_qa | 256 | Recall@10 = 0.92 | ▲ 0.04 | 完成 |
| eval-217 | OpenRAG 检索 | equip_manual | 180 | NDCG = 0.85 | ▲ 0.02 | 完成 |
| eval-216 | 实体抽取 | customer_eval | 1,200 | F1 = 0.91 | ≈ 0 | 完成 |
| eval-215 | Agent | workorder_e2e | 40 | 完成率 96% | ▲ 1.1 | 完成 |
| eval-214 | 权限 | perm-neg | 120 | 越权拦截 100% | ≈ 0 | 完成 |
| eval-213 | 成本 | — | — | Token/req = 4.2k | ▼ 8% | 完成 |
用户每一次 不满意,都通向一次知识演化。
反馈采集 → 分类 → 定位 → 修复任务 → 文档/图谱/本体/规则/Prompt 更新 → 重新索引 → 评测验证 → 发布。
反馈队列
| # | 来源 | 类型 | 关联 | 分类 | 状态 |
|---|---|---|---|---|---|
| #221 | 合同 Copilot | 幻觉 | qry_8821 | 规则缺失 | 修复中 |
| #220 | 客户 360 | 点踩 | qry_8788 | 检索遗漏 | 已修复 |
| #219 | 设备故障代理 | 工具失败 | trace_4180 | API schema 漂移 | 修复中 |
| #218 | 合规问答 | 低置信 | qry_8702 | 本体覆盖不足 | 本体需求 |
| #217 | 合同审查 | 规则冲突 | — | 条款冲突 | 规则中心 |
| #216 | 客户 360 | 幻觉 | qry_8638 | 引用错位 | 已修复 |
闭环流程
反馈采集 ↓ 问题分类(幻觉 / 检索 / 本体 / 规则 / 工具) ↓ 定位原因(trace + provenance) ↓ 生成修复任务(Issue + 责任人) ↓ 更新 文档 / 图谱 / 本体 / 规则 / Prompt ↓ 重新索引(OpenSearch + Graph) ↓ 评测验证(回归数据集) ↓ 发布
- 合同付款条款歧义
- 设备别名 / 旧编号
- 规则 RULE-DOWNTIME-30 例外
- 工具 create_work_order schema
Kubernetes + Helm,一键私有化。
离线安装 / 内网镜像 / 国产 OS 与 ARM / GPU·NPU / 备份恢复 / 升级演练 —— 部署矩阵 · 容量基线 · 灾备指标产品内生。
命名空间
- knowledge-platform
- openrag
- middleware
- model-serving
- observability
核心容器化服务
- knowledge-api · ontology · mapping
- ingestion · pipeline-worker
- metadata · graph · graphrag
- reasoning · agent-runtime
- tool-registry · policy-gateway
- audit · evaluation · frontend
- openrag-backend · langflow · docling-serve
- opensearch · jena-fuseki · hugegraph
- postgresql · redis · kafka · minio
- temporal · airflow
- keycloak · prometheus · grafana · loki
资源占用
部署矩阵 · MVP / 推荐 / 可选
| 分档 | 组件 | 说明 |
|---|---|---|
| 必选 | K8s · Helm · PG · Redis · Kafka · MinIO · OpenSearch · Keycloak · 监控最小集 | 构成可演示 / 可运维最小闭环 |
| 推荐 | OpenRAG · Adapter · HugeGraph · Temporal · Airflow | M2–M4 引入 |
| 可选 | 第二套图存储 / 独立向量库 / RDF 推理扩展集群 | 需容量 / 许可证 / 运维评估 |
// 默认分工 RDF / Jena Fuseki → 本体 · TBox · SHACL · 命名空间 HugeGraph → 业务实例 · 多跳 · 图分析 // 同步:事件驱动 · 单向派生 Mapping/Ontology "published" event → derive vertex/edge labels → idempotent upsert
灾备 · 容量基线
| 项 | 指标 / 范围 |
|---|---|
| RPO | ≤ 24 h(重要级 ≤ 1 h) |
| RTO | ≤ 4 h |
| 备份范围 | PG · MinIO · OpenSearch · HugeGraph · Kafka 位点 |
| 演练频次 | 每季度 1 次 |
| 大文档异步 | 队列并发 + 背压 + 最大排队时延 |
| OS 适配 | 统信 UOS · 麒麟 · 龙蜥 · openEuler |
| 架构 | x86 · ARM · 国产 GPU/NPU |
| 升级 | Helm rolling · 灰度 · 回滚 |
- Secret / KMS · 凭据轮换
- 内网镜像以 digest 固定 · SBOM
- 南北向网关 · 东西向 mTLS
- 供应链:镜像签名 / 物料清单
近 30 天 SLO
| 指标 | SLO | 实测 P95 | 状态 |
|---|---|---|---|
| 普通知识检索 | P95 < 2s | 1.7s | 达标 |
| GraphRAG 查询 | P95 < 8s | 4.2s | 达标 |
| 小文档可检索 | < 1 min | 38s | 达标 |
| 增量同步延迟 | < 5 min | 38s | 达标 |
| Agent 只读工具 | P95 < 3s | 1.4s | 达标 |
| 并发用户 | ≥ 500 | 1,200 峰值 | 达标 |