要按平台筛选LookWorldPro客户,先定义平台维度(如iOS/Android/Web/微信/API等),在用户属性与行为数据里打标签并建立唯一设备/身份映射,结合注册渠道、设备指纹、登录记录与来源参数,设计可复用的分层筛选规则,在数据仓库或BI/CRM中实现视图与自助筛选,定期校验、去重与同步,输出分层名单供投放、客服与产品使用,可迭代

为什么要按平台筛选客户?先把问题想清楚
按平台筛选客户这件事,看起来简单,实际牵扯到数据采集、身份识别、渠道归因、以及后续运营的复用。如果你是产品经理、运营或市场,目标可能是:
- 精准推送:只给iOS用户推iOS专属活动;
- 行为分析:比较不同平台的留存、付费或转化;
- 渠道优化:识别哪个渠道带来高质量用户;
- 技术支持:按平台分配兼容性或故障排查资源。
因此,按平台筛选不是单纯依赖“设备字段”,而是要把采集、标注、存储、查询和维护串起来。
基本概念:你需要知道的那些术语
- 平台(Platform):通常指用户访问或使用服务的环境,如iOS、Android、Web、微信公众号、小程序、API等。
- 身份ID(User ID):系统内的唯一用户标识,通常与账户绑定。
- 设备ID(Device ID):设备端的标识(IDFA、GAID、设备指纹等),用于区分设备而非用户。
- 渠道来源(Acquisition Source):用户来源信息,如渠道、广告组、落地页参数等。
- 事件与属性(Events & Attributes):行为日志记录(登录、注册、激活、支付)以及用户属性(注册平台、安装时间)。
总体流程:一步一步来(像费曼那样解释)
把复杂问题拆成小块:先采集、再标注、然后存储、接着查询,最后校验与同步。下面我把每一步拆开讲并给出可执行细则。
1. 定义平台维度与优先级
先问你们团队几个问题:
- 哪些“平台”对业务有实际差异?(有时把“微信”和“小程序”分开更有意义)
- 是以设备为主还是以账户为主?(同一账户能否跨平台)
- 筛选结果主要给谁用?市场、产品还是客服?
结论建议:把平台维度列成优先清单(例如:iOS、Android、Web、微信小程序、企业API),并为每一项写清定义和采集来源。
2. 数据采集:哪些字段必须得有
采集层务必做到标准化,至少要确保这些字段在事件或用户快照里有值:
| 字段名 | 类型 | 说明 |
| user_id | string | 系统内唯一用户ID(登录后绑定) |
| platform | string | 注册或最近一次使用的平台(例如:iOS/Android/Web/WeChat/mini_program/API) |
| device_id | string | 设备指纹或系统设备ID(可空,但尽量采集) |
| source | string | 渠道或Utm参数(utm_source、campaign等) |
| event_name | string | 行为事件,如register/login/install |
| event_time | timestamp | 行为发生时间 |
此外,收集User-Agent、app_version、os_version、locale等能帮助做更细分的判断。
3. 标注与建模:如何在数据里“打平台标签”
有两条主线:注册/安装时的“首平台”和最近一次使用的“活跃平台”。
- 首平台(first_platform):用户首次注册或安装时捕获的platform字段,用于长期分类和渠道分析。
- 最近平台(last_platform):用户最近一次行为记录中的platform字段,用于实时或近实时推送决策。
实现方法:
- 在用户注册事件里写入first_platform(不可覆盖);
- 每次登录或关键行为事件更新last_platform(可覆盖);
- 用device_id关联设备信息,避免匿名用户丢失平台线索。
4. 去重与跨设备合并(Identity Resolution)
很多用户会在手机和网页端都使用,这时你要决定结果是否按“设备”还是按“用户”。常用做法:
- 以user_id为主:登录用户合并不同设备的数据,筛选结果按用户计数;
- 以device_id为主:侧重设备层面的活动(适合投放安装类目标);
- 建立映射表(user_id ↔ device_id):存储多设备历史,便于灵活切换。
实际操作中常常同时保留两套视图:按用户的“用户视图”和按设备的“设备视图”。
5. 在数据仓库/BI里实现筛选视图
技术实现上,你需要在数据仓库里建立一个或多个物化视图/表,示例SQL思路:
示例(伪SQL):
SELECT user_id, first_platform, last_platform, array_agg(distinct device_id) as devices FROM user_events GROUP BY user_id;
然后在BI里基于first_platform或last_platform建筛选条件,保存为“Segment / Filter”。
具体策略示例:常见需求与实现要点
场景A:发送iOS专属通知
- 数据条件:last_platform = ‘iOS’ AND push_token IS NOT NULL;
- 注意点:有些iOS用户可能已经卸载或更换设备,需要校验push_token的活跃性;
- 执行:从BI导出名单或直接触发用作推送任务的API。
场景B:对跨平台付费用户做再营销
- 筛选条件:user_id in (select user_id from payments where amount>0) AND last_platform in (‘Web’,’Android’)
- 去重策略:按user_id去重,保留最后活跃平台作为投放目标;
- 同步:将名单导入广告平台时保留user_id映射(若支持hashed id上传更安全)。
场景C:分析平台留存差异
- 维度:first_platform;指标:次日留存、7日留存、付费率;
- 建议:只统计首次渠道归因明确的用户,避免重复计入;
- 工具:用数据仓库做 cohort 分析,或用专门的产品分析工具(如Mixpanel、Amplitude)做对比。
字段与表设计建议(举例)
| 表/视图 | 关键字段 | 用途 |
| user_profile | user_id, first_platform, created_at, email_hash | 存储用户静态属性与首平台 |
| device_map | device_id, user_id, platform, last_seen | 设备与用户映射,便于按设备或用户筛选 |
| event_log | event_id, user_id, device_id, event_name, platform, event_time, params | 行为日志,实时分析与更新last_platform |
同步与自动化:把筛选变成可复用的流水线
筛选完成后,常见需求是把名单供不同系统使用(广告投放、CRM、客服)。推荐做法:
- 实现定时Job(如每天/每小时)在数据仓库导出最新分层名单;
- 使用API或SFTP把名单同步到广告平台或CRM;
- 对敏感字段做脱敏处理(如email哈希、手机脱敏);
- 记录同步日志与校验行数,确保数据完整性。
常见问题与坑(别踩雷)
- 字段不一致:不同SDK或渠道字段名或值域不统一,先做清洗和映射规则。
- 匿名用户丢失平台标签:未登录的匿名用户难以关联历史,建议采集device_id并在登录时回填。
- 跨平台重复计数:统计时明确按用户或按设备口径,避免指标偏差。
- 渠道伪装/UTM丢失:应用跳转、短链或第三方平台可能破坏渠道参数,需要后续归因修复策略。
- GDPR/数据合规:导出名单前确认是否有用户拒绝数据使用或需要额外同意。
质量控制与监测指标
要保证平台筛选长期可用,需要监测这些健康指标:
- *字段完备率*:platform、device_id、event_time 的非空率;
- *平台分布稳定性*:每日各平台新增用户占比的波动;
- *同步成功率*:导出/同步任务的成功次数与失败原因;
- *去重率*:导出名单中重复user_id或device_id比例;
- *命中率*:投放回传或客服反馈与筛选名单的匹配度。
示例检查清单(执行时照着做)
- 是否定义并记录了first_platform与last_platform?
- 是否在注册/登录事件中捕获并持久化platform字段?
- 是否维护了device_id ↔ user_id映射表?
- 是否在数据仓库建立了物化视图并保存筛选模板?
- 是否有自动化同步机制和同步日志?
- 是否考虑了隐私与脱敏要求?
- 是否设定了质量监控指标并报警?
小技巧与实践经验(真实感)
- 如果渠道参数经常丢失,优先用“注册页面隐藏字段”或“落地页cookie”补偿;
- 对那些经常跨平台切换的重度用户,建立“多平台标签”,便于做跨端体验优化;
- 把常用的筛选模板(如“近30天活跃iOS付费用户”)在BI里保存为共享Segment,减少重复工作;
- 做一次小规模的导出测试并在目标系统做回测,确认字段映射和脱敏策略没问题再批量同步。
工具和技术栈建议
- 埋点/事件收集:使用统一的SDK或中间层(如Segment、Snowplow)做规范化采集;
- 数据仓库:推荐使用支持大规模查询的DW(如BigQuery、Snowflake、ClickHouse);
- ETL/Sync:Airflow、dbt用于转化,使用Fivetran/Hevo等同步广告平台数据;
- 分析与BI:Looker、Metabase、Tableau或内部自助分析平台;
- 身份解析:若需要复杂的跨设备合并,可考虑自建Identity Graph或使用第三方。
写到这里,突然想到一个会打乱你筛选效果的细节:有些第三方登录(例如企业统一登录)会覆盖原有的first_platform字段,如果没有建立写保护规则,就会把“首平台”搞丢。最好在注册那一步把首平台写死,不容随后的外部登录覆盖。好吧,先说这些,接下来可以根据你们现有的数据架构把SQL模板和同步流程具体化。







