51 lines
2.2 KiB
Markdown
51 lines
2.2 KiB
Markdown
|
|
# DMK 项目第二阶段代码生成审计报告 (Level 2 Audit) - 已修复版
|
||
|
|
|
||
|
|
本报告针对第二阶段(核心事实与明细层)四张表进行审计。
|
||
|
|
|
||
|
|
## 1. 总体审计结论 (Executive Summary)
|
||
|
|
|
||
|
|
> [!TIP]
|
||
|
|
> **审计结论:通过 (PASS)**
|
||
|
|
> 此前发现的导致数据翻倍、语法错误及交付物缺失的致命问题均已完成修复。代码现已符合 SOP 交付标准。
|
||
|
|
|
||
|
|
| 检查项 | 状态 | 说明 |
|
||
|
|
| :--- | :--- | :--- |
|
||
|
|
| **数据准确性** | ✅ 修复 | `td_building_cell_m` 的 3 倍膨胀风险已通过增加 `data_type` 过滤消除。 |
|
||
|
|
| **计算逻辑** | ✅ 修复 | `tm_building_user_wifi_m` 已改用 `EXPLODE` 模式统计去重用户。 |
|
||
|
|
| **语法合规性** | ✅ 修复 | `tm_grid_coverage_m` 的开窗函数已重构为 Hive 兼容的 `STRUCT` 聚合模式。 |
|
||
|
|
| **交付完整性** | ✅ 修复 | `tm_cell_grid_coverage_m` 已补齐同步脚本。 |
|
||
|
|
|
||
|
|
---
|
||
|
|
|
||
|
|
## 2. 修复详情 (Correction Details)
|
||
|
|
|
||
|
|
### 2.1 tm_grid_coverage_m (栅格覆盖事实表)
|
||
|
|
- **compute.sql**:
|
||
|
|
- [x] **已修复**: 使用 `MAX(NAMED_STRUCT(...))` 替代开窗函数,解决了 Hive 聚合报错。
|
||
|
|
- [x] **已修复**: `is_covered` 指标修正为基于 90% 覆盖率阈值。
|
||
|
|
|
||
|
|
### 2.2 td_building_cell_m (楼宇小区桥接表)
|
||
|
|
- **compute.sql**:
|
||
|
|
- [x] **已修复**: 增加了 `data_type = -1` 过滤逻辑,确保 MR 指标只关联电信本网维度,数据统计现已准确。
|
||
|
|
|
||
|
|
### 2.3 tm_cell_grid_coverage_m (小区-栅格事实表)
|
||
|
|
- **compute.sql**:
|
||
|
|
- [x] **已修复**: 修正了 `GROUP BY` 键,所有指标均执行 `SUM` 运算。
|
||
|
|
- [x] **已修复**: 实现了 `cell_grid_line_wkt` (LineString) 的 Hive 侧拼接生成。
|
||
|
|
- **sync.sh**:
|
||
|
|
- [x] **已补齐**: 按照标准模板创建了同步脚本。
|
||
|
|
|
||
|
|
### 2.4 tm_building_user_wifi_m (楼宇 WiFi 专项表)
|
||
|
|
- **compute.sql**:
|
||
|
|
- [x] **已修复**: 引入 `LATERAL VIEW EXPLODE` 处理 `device_id_list`,用户数统计逻辑现已正确。
|
||
|
|
|
||
|
|
---
|
||
|
|
|
||
|
|
## 3. 后续建议
|
||
|
|
1. 建议在 Level 2 运行前,确保 Level 1 的维表已成功同步回 Hive。
|
||
|
|
2. 验证 `tm_cell_grid_coverage_m` 生成的连线 WKT 在 GIS 软件中的渲染效果。
|
||
|
|
|
||
|
|
---
|
||
|
|
**审计人**: Antigravity
|
||
|
|
**日期**: 2026-05-03
|