Post-Launch Review · 上线复盘

产品评价体系优化 V2 · 上线复盘报告

LLM 智能审核 + 评价标签 + 综合排序 + 用户追评 + 官方回复通知 · 上线后 30 天效果复盘
📅 上线日 2026/05/27 · 复盘 2026/05/27–06/25 📊 GA4 主站资源 313302501(全渠道) 🔍 对比基线 上线前 30 天(04/27–05/26) 🧭 渠道口径 US=根路径 · Global=/global 前缀
1.0 总体概览
评价筛选项交互
752
↑ 新功能 · 上线前为 0
全渠道 30 天累计点击
AI 标签筛选使用
138
↑ 占筛选 18.4%
10 个标签均被使用
写评价入口点击
37
新埋点 · 上线前为 0
PDP 评价区入口
用户追评入口点击
6
新功能 · 上线前为 0
My Reviews 追评按钮
PDP 详情页访客
535K
↓ 1.0% vs 上线前
流量基线稳定(分母可靠)

✅ 核心结论:功能已全量上线且产生真实交互,标签筛选验证了用户需求

评价体系 V2 的三项前端新能力(写评价入口、评价筛选、用户追评)上线后均有事件产出,评价筛选项 30 天内累计 752 次交互,证明前台筛选重构与新增的 AI 标签筛选维度被用户实际使用。其中 AI 标签筛选占全部筛选行为的 18.4%(138 次),PRD 设计的 10 个标签全部有用户触达——这是本次上线最明确的正向信号。

⚠️ 关键限制:GA4 仅能度量"交互入口",无法度量核心业务效果

本次 PRD 的核心目标——LLM 审核自动化效果、评价全量展示后的评价总量/星级分布变化、客诉线索识别、转化影响——均不在 GA4 埋点覆盖范围内。GA4 数据只能回答"用户有没有用新功能",无法回答"评价体系优化有没有达成业务目标"。这些缺口必须依赖后端数据补充(详见第 6 章),否则本次复盘不完整。

2.0 流量基线校验 · 评价模块改动未影响详情页流量

复盘前先确认分母稳定:评价模块改动若导致 PDP 流量波动,会污染所有"评价参与率"指标。下表对比上线前后 30 天商品详情页(.html)的访客与浏览量。

PDP 详情页流量 · 上线前 vs 上线后(全渠道合计)

指标上线前 (04/27–05/26)上线后 (05/27–06/25)变化
页面浏览量 eventCount 2,127,380 2,121,103 -0.3%
独立访客 totalUsers 540,486 535,148 -1.0%
会话数 sessions 728,299 764,432 +5.0%

✅ 分母可靠

PDP 浏览量与独立访客在上线前后基本持平(-0.3% / -1.0%,属自然波动范围),会话数小幅 +5%。说明评价体系的前台展示改动(全量展示、排序重构、标签暴露)没有对详情页流量造成负面影响。后续章节所有"评价参与率"指标的横向对比,分母是稳定的,数据可信。

3.0 新功能交互情况 · 三个新埋点

PRD 埋点方案包含 3 个新事件。下表为上线后 30 天全渠道累计交互量(上线前均为 0,因为是新埋点,无基线可比)。

新功能入口交互 · 上线后 30 天

功能入口埋点事件点击次数独立用户渠道分布
评价筛选项交互 product_detail_review_filter_click 752 630 US 323 · EU 206 · AU 50 · JP 38 · DE 35 · UK 27 · Global 59
写评价入口点击 product_detail_write_review_click 37 29 US 17 · EU 13 · DE 2 · UK 1 · CA 1 · Global 3
用户追评入口点击 my_reviews_follow_up_click 6 5 US 2 · EU 4

📌 解读与提醒

  • 筛选重构是用户感知最强的改动:752 次交互远高于另两个入口,说明前台筛选项暴露在 Review 模块的设计被高频使用,PRD 3.2 的排序与筛选优化方向正确。
  • 写评价入口点击偏低(37 次 / 535K 访客 ≈ 0.007%):但这只是 PDP 评价区的入口点击,真实的评价提交主要来自订单完成后的邮件邀评链路,PDP 入口点击低属于正常结构。评价总量的变化需看后端数据,不能据此判定"评价增长不及预期"。
  • 追评入口点击仅 6 次:作为第一期仅在 My Reviews 增加入口的新功能,6 次点击属冷启动量级。需结合后端"追评实际提交数"判断转化,并观察是否需要扩大入口(如订单页、邮件)。
4.0 评价筛选项分布 · AI 标签需求得到验证

这是本次复盘最有价值的一组数据:上线后 30 天全渠道 752 次筛选交互,按筛选项类型拆解。绿色=评价类型,紫色=AI 标签(PRD 新增),蓝色=排序,琥珀=星级

评价类型(图/视频/全部) AI 评价标签(新增) 排序 星级筛选

筛选项点击分布 · 全渠道合计(按次数降序)

筛选项类别分布点击次数占比
图片评价 image评价类型
100
24132.1%
最新 Newest排序
45
10914.5%
全部 All评价类型
28
689.0%
5 Star星级
24
597.8%
4 Star星级
24
577.6%
3 Star星级
12
293.9%
视频评价 video评价类型
12
283.7%
Good Quality 质量好AI 标签
11
273.6%
Sturdy Build 结实耐用AI 标签
10
243.2%
Great Value 性价比高AI 标签
10
233.1%
Compact Size 小巧便携AI 标签
8
202.7%
1 Star星级
7
162.1%
Versatile 功能多AI 标签
6
141.9%
Easy to Install 易安装AI 标签
4
101.3%
2 Star星级
3
70.9%
Perfect Fit 尺寸合适AI 标签
3
70.9%
Stylish Design 颜值高AI 标签
3
70.9%
Fast Shipping 物流快AI 标签
2
50.7%
Lightweight 轻便AI 标签
0
10.1%
44.8%
评价类型(图/视频/全部)
22.3%
星级筛选
18.4%
AI 评价标签(新增)
14.5%
最新排序

✅ AI 标签功能需求得到验证

  • 10 个标签全部被使用,无零曝光标签,说明 LLM 标签提取 + 前台展示链路打通且有效。
  • 标签合计占筛选 18.4%(138 次),作为一个全新维度,已经接近"星级筛选"(22.3%)的使用量,用户接受度良好。
  • 使用最多的标签是 Good Quality(质量好)、Sturdy Build(结实耐用)、Great Value(性价比高)——符合 SmallRig 影视器材用户的核心关注点,标签设计贴合产品定位。

📌 用户筛选行为洞察

  • 图片评价筛选排名第一(32.1%):用户最想看带图的真实反馈。这印证了 PRD 综合排序里"多媒体权重 +30"的合理性——带图评价参考价值最高。
  • 星级筛选(1-5 Star)合计 22.3%,且 1-3 星低星筛选有真实点击:上线"全量展示"后,用户确实会主动查看中差评,验证了"消除隐瞒负面疑虑"这一需求目标的合理性。
5.0 分渠道对比 · 评价参与度

评价筛选项交互 · 分渠道(上线后 30 天)

渠道筛选点击PDP 访客参与率分布
US 美国主站323242,0000.013%
43.0%
EU 欧洲206116,5290.018%
27.4%
AU 澳大利亚5027,4220.018%
6.6%
JP 日本3825,4460.015%
5.1%
Global 品牌站5947,2720.012%
7.8%
DE 德国3544,3000.008%
4.7%
UK 英国2731,0560.009%
3.6%
KR 韩国93,6910.024%
1.2%
CA 加拿大511,7430.004%
0.7%
全渠道合计752535,1480.014%
100%

📌 渠道洞察

  • US + EU 两站贡献 70% 的筛选交互(323 + 206 = 529),与两站 PDP 流量体量一致,无异常。
  • Global 品牌站单独拆出:59 次筛选 / 47K 访客,参与率 0.012%,与 US 主站(0.013%)接近,属正常水平。
  • KR 韩国、EU、AU 参与率(点击/访客)相对偏高,KR 虽体量小但参与率达 0.024%,说明这些市场用户对评价筛选更主动,可作为后续评价运营的重点市场。
  • DE 德国、CA 加拿大参与率偏低(0.004%-0.009%),DE 流量不小但筛选互动低,建议关注是否德语标签翻译或评价内容丰富度存在本地化问题。
7.0 结论与优化建议

表现复盘 · 对照 PRD 验收标准

维度预期实际(GA4 可观测)判定
前台筛选重构上线筛选项被使用752 次筛选交互,4 类筛选维度均触达符合
AI 评价标签展示标签有用户触达10 个标签全部被使用,占筛选 18.4%符合
全量展示无负作用不影响 PDP 流量PDP 访客 -1%,浏览量 -0.3%(稳定)符合
追评功能上线入口可用6 次入口点击(冷启动)待观察
LLM 审核效果替代人工星级审核GA4 不可观测数据缺口
评价总量增长全量展示后增长GA4 不可观测数据缺口

✅ 已验证的(GA4 可确认)

前台三大新能力(筛选重构、AI 标签、追评入口)均已上线并产生真实交互;AI 标签功能需求得到用户行为验证(10 标签全覆盖、占筛选 18.4%);评价模块改动未拖累 PDP 流量。本次上线在前台体验层面达成预期

🎯 优化建议

  • [P0] 补齐后端数据闭环:拉取 BI 看板或后端日志,补全 LLM 审核通过率、评价总量、星级分布、客诉识别数等核心指标,2 周内完成完整版复盘。
  • [P1] 标签运营深化:Good Quality / Sturdy Build / Great Value 是高频标签,可将高频标签商品做专题聚合页或营销素材复用。
  • [P1] DE 德国本地化排查:DE 流量不小但筛选参与率偏低,排查德语标签翻译质量与德语评价内容丰富度。
  • [P2] 补埋点:当前只有 3 个入口埋点,建议补充"官方回复展示曝光""Pending Review 标识曝光""AI 总结展开"等事件,让下次复盘能度量更深层的交互。