50 lines
1.8 KiB
Markdown
Raw Normal View History

# td_building_cell_m 执行说明
## 表说明
楼宇小区桥接月表建立电信小区与楼宇实体的业务归属关系支撑楼宇维度的Top小区分析。
## 执行步骤
### 1. 前置依赖
**必须先执行以下表**
- `td_building_grid_m`必须已同步回Hive提供楼宇-栅格映射)
### 2. 在Hive中执行计算
```bash
hive -hivevar:year_month=2026-05 -f src/td_building_cell_m/compute.sql
```
或直接在Hive CLI中执行 `src/td_building_cell_m/compute.sql` 中的SQL
### 3. 执行同步脚本
```bash
bash src/td_building_cell_m/sync.sh
```
### 4. 验证数据
在PG中执行
```sql
SELECT COUNT(*) FROM dmk.td_building_cell_m; -- 应大于0
SELECT year_month, building_id, cellkey, indoor_flag, rsrpcount
FROM dmk.td_building_cell_m LIMIT 10; -- 检查多口径关联结果
```
## 计算侧与持久化
- **计算侧**HiveSQL默认侧
- **持久化侧**PostgreSQL
- **双侧冗余**本表需在Hive和PG双侧保留
## 关键计算逻辑
1. **多口径关联**
- 明细映射(0/1)ON a.regionid = b.regionid AND a.indoor_flag = b.indoor_flag
- 全量映射(-1)ON a.regionid = b.regionid AND a.indoor_flag = -1不检查MR侧flag
2. **运营商过滤**:只提取 operator_name = 'telecom' 的记录
3. **4G/5G采样点字段**4G用rsrpcount5G用ssrsrpcount严禁混淆
4. **聚合分组**:按 building_id, cellkey, indoor_flag 分组SUM(rsrpcount)
5. **全量保留**有采样的小区映射全保留不进行Top N截断
## 注意事项
1. 必须确保 td_building_grid_m 已同步回Hive
2. 4G/5G采样点字段严禁混淆
3. cell_geom由GENERATED列自动生成当cell_wkt或cell_lon/cell_lat存在时
4. 同步脚本中的数据库连接参数需根据实际情况修改