47 lines
1.6 KiB
Markdown
Raw Normal View History

# tm_building_user_wifi_m 执行说明
## 表说明
楼宇 WiFi 指标月表,分析楼宇内用户的 WiFi 连接偏好与蜂窝网络协同情况,楼宇 4G/5G_SA 用户数和市场份额落在 tm_building_coverage_m。
## 执行步骤
### 1. 前置依赖
**必须先执行以下表**
- `td_building`(楼宇维表#,需已入库)
### 2. 在Hive中执行计算
```bash
hive -hivevar:year_month=2026-05 -f src/tm_building_user_wifi_m/compute.sql
```
或直接在Hive CLI中执行 `src/tm_building_user_wifi_m/compute.sql` 中的SQL
### 3. 执行同步脚本
```bash
bash src/tm_building_user_wifi_m/sync.sh
```
### 4. 验证数据
在PG中执行
```sql
SELECT COUNT(*) FROM dmk.tm_building_user_wifi_m; -- 应大于0
SELECT year_month, building_id, wifi_total_user_count, wifi_user_count, wifi_market_share
FROM dmk.tm_building_user_wifi_m LIMIT 10; -- 检查WiFi指标
```
## 计算侧与持久化
- **计算侧**HiveSQL默认侧
- **持久化侧**PostgreSQL
## 关键计算逻辑
1. **数据源**ODS OTT WiFi数据
2. **indoor_flag固定-1**由于无MR数据支撑WiFi指标
3. **用户统计**:使用 approx_count_distinct(device_id_list) 统计连接特定WiFi的去重用户数
4. **关联逻辑**:通过 device_id 关联用户的蜂窝覆盖指标以分析WiFi卸载价值
5. **WiFi市场份额**本运营商WiFi用户数 / 总WiFi用户数
## 注意事项
1. 仅关注电信(telecom)数据
2. WiFi指标独立于蜂窝网络指标
3. 楼宇4G/5G用户数和市场份额实际落在 tm_building_coverage_m
4. 同步脚本中的数据库连接参数需根据实际情况修改