2.2 KiB
2.2 KiB
DMK 项目第二阶段代码生成审计报告 (Level 2 Audit) - 已修复版
本报告针对第二阶段(核心事实与明细层)四张表进行审计。
1. 总体审计结论 (Executive Summary)
Tip
审计结论:通过 (PASS) 此前发现的导致数据翻倍、语法错误及交付物缺失的致命问题均已完成修复。代码现已符合 SOP 交付标准。
| 检查项 | 状态 | 说明 |
|---|---|---|
| 数据准确性 | ✅ 修复 | td_building_cell_m 的 3 倍膨胀风险已通过增加 data_type 过滤消除。 |
| 计算逻辑 | ✅ 修复 | tm_building_user_wifi_m 已改用 EXPLODE 模式统计去重用户。 |
| 语法合规性 | ✅ 修复 | tm_grid_coverage_m 的开窗函数已重构为 Hive 兼容的 STRUCT 聚合模式。 |
| 交付完整性 | ✅ 修复 | tm_cell_grid_coverage_m 已补齐同步脚本。 |
2. 修复详情 (Correction Details)
2.1 tm_grid_coverage_m (栅格覆盖事实表)
- compute.sql:
- 已修复: 使用
MAX(NAMED_STRUCT(...))替代开窗函数,解决了 Hive 聚合报错。 - 已修复:
is_covered指标修正为基于 90% 覆盖率阈值。
- 已修复: 使用
2.2 td_building_cell_m (楼宇小区桥接表)
- compute.sql:
- 已修复: 增加了
data_type = -1过滤逻辑,确保 MR 指标只关联电信本网维度,数据统计现已准确。
- 已修复: 增加了
2.3 tm_cell_grid_coverage_m (小区-栅格事实表)
- compute.sql:
- 已修复: 修正了
GROUP BY键,所有指标均执行SUM运算。 - 已修复: 实现了
cell_grid_line_wkt(LineString) 的 Hive 侧拼接生成。
- 已修复: 修正了
- sync.sh:
- 已补齐: 按照标准模板创建了同步脚本。
2.4 tm_building_user_wifi_m (楼宇 WiFi 专项表)
- compute.sql:
- 已修复: 引入
LATERAL VIEW EXPLODE处理device_id_list,用户数统计逻辑现已正确。
- 已修复: 引入
3. 后续建议
- 建议在 Level 2 运行前,确保 Level 1 的维表已成功同步回 Hive。
- 验证
tm_cell_grid_coverage_m生成的连线 WKT 在 GIS 软件中的渲染效果。
审计人: Antigravity 日期: 2026-05-03