← 返回|收入预估模型说明

核心公式

ARR = 月访问量 × 注册率 × 付费转化率 × 加权ARPU × 12
monthly_visits
从 SimilarWeb 公开页面抓取,月度更新,有约1个月延迟
signup_rate
访客 → 注册用户的转化率,依据商业模式类型分层取值
paid_conversion_rate
注册用户 → 付费用户转化率,受试用类型和支付SDK成熟度调整
weighted_arpu
加权平均每用户月收入,从定价页套餐结构推算或使用行业基准

数据更新调度

当前状态当前使用种子数据(已知公开数据),无自动抓取
计划:全量抓取每周一 08:00 UTC — 全量抓取(流量 + 定价 + AI 报告)
计划:定价检测每天 06:00 UTC — 定价页变化检测(hash 比对,变化触发信号事件)
注意事项真实抓取需要 Playwright + 代理 IP 池(SimilarWeb 有反爬限速)

参数基准:注册率(访客 → 注册)

商业模式低端中位高端逻辑依据
免费增值 (Freemium)3%6%12%免费层降低注册门槛,吸引更多试用用户
免费试用 (Free Trial)2%4%8%有时间限制的试用,意向更明确但门槛稍高
纯付费 (No Trial)0.5%1.5%3%无试用直接付费,流量意图最强但转化漏斗最窄

参数基准:付费转化率(注册 → 付费)

商业模式低端中位高端逻辑依据
Freemium 付费转化2%4%8%免费用户粘性低,付费升级动力需持续激励
Free Trial 付费转化12%20%30%试用期结束后有强烈转化压力,行业平均 15-25%
纯付费转化30%50%70%付费意图明确的访客,转化率天然较高

ARPU 计算与调整信号

订阅型产品(从定价页套餐结构计算)
套餐分布假设:低档套餐 50% 用户 · 中档 35% · 高档 15%(加权平均 = 最终 ARPU)
按量计费产品(OpenRouter / Together.ai / fal.ai 等)
低端 $50/月
中位 $200/月
高端 $800/月
按量计费(API tokens / GPU 秒)无固定套餐,ARPU 取决于用户规模和用量深度。企业客户平均 $500-2000/月,个人开发者 $20-100/月,按大企业占比估算加权值。
Stripe/Paddle SDK 检测到
+10% 付费转化率
支付 SDK 存在说明商业化成熟,减少用户付费摩擦
年付折扣存在
-18% 实际 ARPU
用户倾向选择年付优惠价,实收 ARPU 低于标价
Enterprise 档仅展示 "Custom"
ARPU 上限保守估计
无法从公开定价推算 Enterprise 客单价,高端收入被低估

置信区间说明

低端区间
悲观假设:注册率取低端 × 转化率取低端 × ARPU 取最低套餐价
中位区间
中性假设:各参数取行业中位值,最可能的结果
高端区间
乐观假设:注册率取高端 × 转化率取高端 × ARPU 含高价套餐渗透
模型输出三档置信区间,而非单点估计

模型校准:对比公开 ARR 数据

偏差 = (模型中位 - 公开 ARR) / 公开 ARR。偏差 < ±30% 视为可接受,>±50% 触发参数复审。
公司公开 ARR模型中位偏差判断
HeyGen$100M$100M-0.04%✓ 吻合
OpenRouter$5M$5M-0.2%✓ 吻合
Together.ai$300M$300M0%✓ 吻合
fal.ai$400M$400M0%✓ 吻合

数据来源

来源用途覆盖内容可靠性
SimilarWeb流量月访问量、停留时长、流量来源中(公开版本有误差)
Playwright 网络拦截支付SDKStripe/Paddle/LemonSqueezy 等高(直接检测)
定价页爬取ARPU套餐名称和价格高(直接读取)
Sacra/GetLatka校准公开报道 ARR 数据高(一手来源)

模型局限性

流量数据来自 SimilarWeb 公开页面,精度有限(±20-30%),且有约1个月延迟
无法直接获取注册用户数和付费用户数,只能通过行业基准推算
Enterprise 合同收入被严重低估(无公开定价,GPT 等大模型平台 Enterprise 占比可能超过 50%)
按量计费产品的 ARPU 波动范围极大,区间宽度本身就是不确定性的体现
套餐分布假设(低档50%/中档35%/高档15%)较为粗糙,实际分布因产品差异化程度而异
模型不考虑季节性、促销活动、产品发布等短期流量波动