评价体系 V2 的三项前端新能力(写评价入口、评价筛选、用户追评)上线后均有事件产出,评价筛选项 30 天内累计 752 次交互,证明前台筛选重构与新增的 AI 标签筛选维度被用户实际使用。其中 AI 标签筛选占全部筛选行为的 18.4%(138 次),PRD 设计的 10 个标签全部有用户触达——这是本次上线最明确的正向信号。
本次 PRD 的核心目标——LLM 审核自动化效果、评价全量展示后的评价总量/星级分布变化、客诉线索识别、转化影响——均不在 GA4 埋点覆盖范围内。GA4 数据只能回答"用户有没有用新功能",无法回答"评价体系优化有没有达成业务目标"。这些缺口必须依赖后端数据补充(详见第 6 章),否则本次复盘不完整。
复盘前先确认分母稳定:评价模块改动若导致 PDP 流量波动,会污染所有"评价参与率"指标。下表对比上线前后 30 天商品详情页(.html)的访客与浏览量。
| 指标 | 上线前 (04/27–05/26) | 上线后 (05/27–06/25) | 变化 |
|---|---|---|---|
| 页面浏览量 eventCount | 2,127,380 | 2,121,103 | -0.3% |
| 独立访客 totalUsers | 540,486 | 535,148 | -1.0% |
| 会话数 sessions | 728,299 | 764,432 | +5.0% |
PDP 浏览量与独立访客在上线前后基本持平(-0.3% / -1.0%,属自然波动范围),会话数小幅 +5%。说明评价体系的前台展示改动(全量展示、排序重构、标签暴露)没有对详情页流量造成负面影响。后续章节所有"评价参与率"指标的横向对比,分母是稳定的,数据可信。
PRD 埋点方案包含 3 个新事件。下表为上线后 30 天全渠道累计交互量(上线前均为 0,因为是新埋点,无基线可比)。
| 功能入口 | 埋点事件 | 点击次数 | 独立用户 | 渠道分布 |
|---|---|---|---|---|
| 评价筛选项交互 | product_detail_review_filter_click |
752 | 630 | US 323 · EU 206 · AU 50 · JP 38 · DE 35 · UK 27 · Global 59 |
| 写评价入口点击 | product_detail_write_review_click |
37 | 29 | US 17 · EU 13 · DE 2 · UK 1 · CA 1 · Global 3 |
| 用户追评入口点击 | my_reviews_follow_up_click |
6 | 5 | US 2 · EU 4 |
这是本次复盘最有价值的一组数据:上线后 30 天全渠道 752 次筛选交互,按筛选项类型拆解。绿色=评价类型,紫色=AI 标签(PRD 新增),蓝色=排序,琥珀=星级。
| 筛选项 | 类别 | 分布 | 点击次数 | 占比 |
|---|---|---|---|---|
| 图片评价 image | 评价类型 | 241 | 32.1% | |
| 最新 Newest | 排序 | 109 | 14.5% | |
| 全部 All | 评价类型 | 68 | 9.0% | |
| 5 Star | 星级 | 59 | 7.8% | |
| 4 Star | 星级 | 57 | 7.6% | |
| 3 Star | 星级 | 29 | 3.9% | |
| 视频评价 video | 评价类型 | 28 | 3.7% | |
| Good Quality 质量好 | AI 标签 | 27 | 3.6% | |
| Sturdy Build 结实耐用 | AI 标签 | 24 | 3.2% | |
| Great Value 性价比高 | AI 标签 | 23 | 3.1% | |
| Compact Size 小巧便携 | AI 标签 | 20 | 2.7% | |
| 1 Star | 星级 | 16 | 2.1% | |
| Versatile 功能多 | AI 标签 | 14 | 1.9% | |
| Easy to Install 易安装 | AI 标签 | 10 | 1.3% | |
| 2 Star | 星级 | 7 | 0.9% | |
| Perfect Fit 尺寸合适 | AI 标签 | 7 | 0.9% | |
| Stylish Design 颜值高 | AI 标签 | 7 | 0.9% | |
| Fast Shipping 物流快 | AI 标签 | 5 | 0.7% | |
| Lightweight 轻便 | AI 标签 | 1 | 0.1% |
| 渠道 | 筛选点击 | PDP 访客 | 参与率 | 分布 |
|---|---|---|---|---|
| US 美国主站 | 323 | 242,000 | 0.013% | |
| EU 欧洲 | 206 | 116,529 | 0.018% | |
| AU 澳大利亚 | 50 | 27,422 | 0.018% | |
| JP 日本 | 38 | 25,446 | 0.015% | |
| Global 品牌站 | 59 | 47,272 | 0.012% | |
| DE 德国 | 35 | 44,300 | 0.008% | |
| UK 英国 | 27 | 31,056 | 0.009% | |
| KR 韩国 | 9 | 3,691 | 0.024% | |
| CA 加拿大 | 5 | 11,743 | 0.004% | |
| 全渠道合计 | 752 | 535,148 | 0.014% |
| 维度 | 预期 | 实际(GA4 可观测) | 判定 |
|---|---|---|---|
| 前台筛选重构上线 | 筛选项被使用 | 752 次筛选交互,4 类筛选维度均触达 | 符合 |
| AI 评价标签展示 | 标签有用户触达 | 10 个标签全部被使用,占筛选 18.4% | 符合 |
| 全量展示无负作用 | 不影响 PDP 流量 | PDP 访客 -1%,浏览量 -0.3%(稳定) | 符合 |
| 追评功能上线 | 入口可用 | 6 次入口点击(冷启动) | 待观察 |
| LLM 审核效果 | 替代人工星级审核 | GA4 不可观测 | 数据缺口 |
| 评价总量增长 | 全量展示后增长 | GA4 不可观测 | 数据缺口 |
前台三大新能力(筛选重构、AI 标签、追评入口)均已上线并产生真实交互;AI 标签功能需求得到用户行为验证(10 标签全覆盖、占筛选 18.4%);评价模块改动未拖累 PDP 流量。本次上线在前台体验层面达成预期。