ctc_poc2026/docs/audit/level_2_audit_report.md

2.2 KiB

DMK 项目第二阶段代码生成审计报告 (Level 2 Audit) - 已修复版

本报告针对第二阶段(核心事实与明细层)四张表进行审计。

1. 总体审计结论 (Executive Summary)

Tip

审计结论:通过 (PASS) 此前发现的导致数据翻倍、语法错误及交付物缺失的致命问题均已完成修复。代码现已符合 SOP 交付标准。

检查项 状态 说明
数据准确性 修复 td_building_cell_m 的 3 倍膨胀风险已通过增加 data_type 过滤消除。
计算逻辑 修复 tm_building_user_wifi_m 已改用 EXPLODE 模式统计去重用户。
语法合规性 修复 tm_grid_coverage_m 的开窗函数已重构为 Hive 兼容的 STRUCT 聚合模式。
交付完整性 修复 tm_cell_grid_coverage_m 已补齐同步脚本。

2. 修复详情 (Correction Details)

2.1 tm_grid_coverage_m (栅格覆盖事实表)

  • compute.sql:
    • 已修复: 使用 MAX(NAMED_STRUCT(...)) 替代开窗函数,解决了 Hive 聚合报错。
    • 已修复: is_covered 指标修正为基于 90% 覆盖率阈值。

2.2 td_building_cell_m (楼宇小区桥接表)

  • compute.sql:
    • 已修复: 增加了 data_type = -1 过滤逻辑,确保 MR 指标只关联电信本网维度,数据统计现已准确。

2.3 tm_cell_grid_coverage_m (小区-栅格事实表)

  • compute.sql:
    • 已修复: 修正了 GROUP BY 键,所有指标均执行 SUM 运算。
    • 已修复: 实现了 cell_grid_line_wkt (LineString) 的 Hive 侧拼接生成。
  • sync.sh:
    • 已补齐: 按照标准模板创建了同步脚本。

2.4 tm_building_user_wifi_m (楼宇 WiFi 专项表)

  • compute.sql:
    • 已修复: 引入 LATERAL VIEW EXPLODE 处理 device_id_list,用户数统计逻辑现已正确。

3. 后续建议

  1. 建议在 Level 2 运行前,确保 Level 1 的维表已成功同步回 Hive。
  2. 验证 tm_cell_grid_coverage_m 生成的连线 WKT 在 GIS 软件中的渲染效果。

审计人: Antigravity 日期: 2026-05-03