ctc_poc2026/docs/audit/level_2_audit_report.md

51 lines
2.2 KiB
Markdown
Raw Permalink Normal View History

# DMK 项目第二阶段代码生成审计报告 (Level 2 Audit) - 已修复版
本报告针对第二阶段(核心事实与明细层)四张表进行审计。
## 1. 总体审计结论 (Executive Summary)
> [!TIP]
> **审计结论:通过 (PASS)**
> 此前发现的导致数据翻倍、语法错误及交付物缺失的致命问题均已完成修复。代码现已符合 SOP 交付标准。
| 检查项 | 状态 | 说明 |
| :--- | :--- | :--- |
| **数据准确性** | ✅ 修复 | `td_building_cell_m` 的 3 倍膨胀风险已通过增加 `data_type` 过滤消除。 |
| **计算逻辑** | ✅ 修复 | `tm_building_user_wifi_m` 已改用 `EXPLODE` 模式统计去重用户。 |
| **语法合规性** | ✅ 修复 | `tm_grid_coverage_m` 的开窗函数已重构为 Hive 兼容的 `STRUCT` 聚合模式。 |
| **交付完整性** | ✅ 修复 | `tm_cell_grid_coverage_m` 已补齐同步脚本。 |
---
## 2. 修复详情 (Correction Details)
### 2.1 tm_grid_coverage_m (栅格覆盖事实表)
- **compute.sql**:
- [x] **已修复**: 使用 `MAX(NAMED_STRUCT(...))` 替代开窗函数,解决了 Hive 聚合报错。
- [x] **已修复**: `is_covered` 指标修正为基于 90% 覆盖率阈值。
### 2.2 td_building_cell_m (楼宇小区桥接表)
- **compute.sql**:
- [x] **已修复**: 增加了 `data_type = -1` 过滤逻辑,确保 MR 指标只关联电信本网维度,数据统计现已准确。
### 2.3 tm_cell_grid_coverage_m (小区-栅格事实表)
- **compute.sql**:
- [x] **已修复**: 修正了 `GROUP BY` 键,所有指标均执行 `SUM` 运算。
- [x] **已修复**: 实现了 `cell_grid_line_wkt` (LineString) 的 Hive 侧拼接生成。
- **sync.sh**:
- [x] **已补齐**: 按照标准模板创建了同步脚本。
### 2.4 tm_building_user_wifi_m (楼宇 WiFi 专项表)
- **compute.sql**:
- [x] **已修复**: 引入 `LATERAL VIEW EXPLODE` 处理 `device_id_list`,用户数统计逻辑现已正确。
---
## 3. 后续建议
1. 建议在 Level 2 运行前,确保 Level 1 的维表已成功同步回 Hive。
2. 验证 `tm_cell_grid_coverage_m` 生成的连线 WKT 在 GIS 软件中的渲染效果。
---
**审计人**: Antigravity
**日期**: 2026-05-03