数据分析指南

数据分析教程

数据分析指南

Micker 社区数据分析工具使用教程。

目录

  1. 数据看板
  2. 用户行为分析
  3. 内容趋势分析
  4. 数据导出
  5. 高级分析

数据看板

访问路径

路径:/analytics/dashboard
权限:数据分析师及以上

核心指标卡片

用户指标

指标说明更新频率
总用户数累计注册用户实时
DAU日活跃用户数每小时
MAU月活跃用户数每天
新增用户当日新增注册实时
留存率次日/7 日/30 日留存每天

内容指标

指标说明更新频率
总帖子数累计发帖数量实时
日增帖子当日新增帖子实时
平均互动率(点赞 + 评论)/浏览每小时
优质内容数加精/置顶帖子每天

互动指标

指标说明更新频率
总点赞数累计点赞次数实时
总评论数累计评论数量实时
人均互动每用户平均互动数每天
互动趋势24 小时互动变化每小时

趋势图表

用户增长趋势

  • 折线图展示
  • 时间粒度:日/周/月
  • 对比功能:同比/环比
  • 预测功能:基于历史数据预测

活跃度分布

  • 24 小时活跃热力图
  • 工作日 vs 周末对比
  • 时段分布柱状图
  • 高峰时段标注

内容分类占比

  • 饼图展示各类目占比
  • 支持多层级下钻
  • 动态筛选时间范围
  • 导出图片/PDF

用户行为分析

用户分群

按活跃度

  • 超级活跃: 每日登录且发帖
  • 活跃用户: 每周登录 3 次以上
  • 普通用户: 每周登录 1-2 次
  • 潜水用户: 每月登录 1-3 次
  • 流失用户: 超过 30 天未登录

按内容类型

  • 内容创作者(发帖>10)
  • 评论达人(评论>50)
  • 点赞狂魔(点赞>100)
  • 潜水观察者(只浏览)

按用户价值

  • KOL 用户(粉丝>1000)
  • 核心用户(粉丝 100-1000)
  • 活跃用户(粉丝 10-100)
  • 普通用户(粉丝<10)

用户路径分析

典型路径

注册 → 完善资料 → 浏览 → 点赞 → 评论 → 发帖

转化漏斗

  1. 访问首页: 100%
  2. 点击帖子: 65%
  3. 点赞/评论: 25%
  4. 关注作者: 15%
  5. 自己发帖: 8%
  6. 持续活跃: 5%

流失节点

  • 注册后未完善资料:30%
  • 首次发帖后未继续:45%
  • 7 天后不再登录:60%

用户画像

基础属性

  • 地域分布(省份/城市)
  • 年龄段分布
  • 性别比例
  • 设备类型(移动端/桌面)

兴趣标签

  • 关注话题 TOP10
  • 发帖标签分布
  • 浏览偏好分析
  • 兴趣聚类分组

内容趋势分析

热门内容

实时热门

  • 当前浏览最多(1 小时内)
  • 当前互动最多(1 小时内)
  • 当前分享最多(1 小时内)

日榜/周榜/月榜

维度包括:

  • 最多浏览
  • 最多点赞
  • 最多评论
  • 最多分享
  • 最多收藏

话题趋势

热门标签

路径:/analytics/tags

分析维度:

  • 标签使用频次
  • 标签增长率
  • 标签关联度
  • 新兴标签发现

话题生命周期

  1. 萌芽期: 少数用户开始讨论
  2. 成长期: 参与度快速上升
  3. 爆发期: 达到热度峰值
  4. 衰退期: 热度逐渐下降

内容质量分析

质量评分模型

质量分 = 0.3×互动率 + 0.3×完成率 + 0.2×原创度 + 0.2×专业性

指标说明:

  • 互动率: (点赞 + 评论 + 分享) / 浏览
  • 完成率: 完整阅读用户占比
  • 原创度: 内容原创性检测
  • 专业性: 内容深度评估

优质内容特征

  • 标题吸引力(15-25 字)
  • 内容长度(800-2000 字)
  • 配图数量(2-5 张)
  • 段落清晰(有小标题)
  • 标签准确(3-5 个)

数据导出

导出格式

支持格式:

  • CSV: 适合 Excel 处理
  • XLSX: 带格式的电子表格
  • JSON: 程序处理
  • PDF: 报表展示

导出维度

用户数据

  • 用户基本信息
  • 用户行为日志
  • 用户增长趋势
  • 用户分群统计

内容数据

  • 帖子列表及统计
  • 评论数据
  • 标签使用统计
  • 内容质量评分

互动数据

  • 点赞记录
  • 评论记录
  • 关注关系
  • 分享记录

自定义报表

创建报表

  1. 选择数据源
  2. 设置筛选条件
  3. 选择展示字段
  4. 配置图表类型
  5. 保存报表模板

定时任务

  • 每日自动导出
  • 每周汇总报告
  • 每月深度分析
  • 发送到指定邮箱

高级分析

预测分析

用户流失预测

基于以下特征预测:

  • 登录频率下降
  • 互动行为减少
  • 内容消费降低
  • 社交关系弱化

内容热度预测

预测因素:

  • 作者影响力
  • 发布时间
  • 话题热度
  • 初始互动数据

推荐算法分析

推荐效果评估

  • 推荐点击率 (CTR)
  • 推荐转化率
  • 用户满意度
  • 多样性指标

A/B 测试

  • 算法版本对比
  • 界面布局测试
  • 功能开关测试
  • 推送策略测试

社交网络分析

关系图谱

  • 关注关系网络
  • 互动关系网络
  • 社区发现
  • 关键节点识别

影响力分析

  • PageRank 算法
  • 传播路径追踪
  • 意见领袖识别
  • 信息传播范围

SQL 查询示例

常用查询

DAU 计算

SELECT 
  DATE(login_time) AS date,
  COUNT(DISTINCT user_id) AS dau
FROM user_logins
WHERE login_time >= DATE_SUB(CURDATE(), INTERVAL 30 DAY)
GROUP BY DATE(login_time)
ORDER BY date;

留存率计算

WITH cohort AS (
  SELECT 
    user_id,
    DATE(MIN(created_at)) AS cohort_date
  FROM users
  GROUP BY user_id
),
retention AS (
  SELECT 
    c.cohort_date,
    DATE(l.login_time) AS login_date,
    COUNT(DISTINCT c.user_id) AS users
  FROM cohort c
  JOIN user_logins l ON c.user_id = l.user_id
  GROUP BY c.cohort_date, DATE(l.login_time)
)
SELECT * FROM retention;

热门帖子

SELECT 
  p.id,
  p.title,
  p.author_id,
  COUNT(DISTINCT l.id) AS likes,
  COUNT(DISTINCT c.id) AS comments,
  p.views,
  (COUNT(DISTINCT l.id) + COUNT(DISTINCT c.id) * 2) / p.views AS engagement_rate
FROM posts p
LEFT JOIN likes l ON p.id = l.post_id
LEFT JOIN comments c ON p.id = c.post_id
WHERE p.created_at >= DATE_SUB(CURDATE(), INTERVAL 7 DAY)
GROUP BY p.id
ORDER BY engagement_rate DESC
LIMIT 20;

工具集成

API 调用

// 获取统计数据
const stats = await fetch('/api/analytics/stats', {
  headers: { 'Authorization': `Bearer ${token}` }
});

// 导出报表
await fetch('/api/analytics/export', {
  method: 'POST',
  headers: { 
    'Authorization': `Bearer ${token}`,
    'Content-Type': 'application/json'
  },
  body: JSON.stringify({
    type: 'user_growth',
    format: 'xlsx',
    dateRange: { start: '2024-01-01', end: '2024-12-31' }
  })
});

Python 分析

import pandas as pd
import matplotlib.pyplot as plt

# 读取导出数据
df = pd.read_csv('user_growth.csv')

# 绘制趋势图
plt.figure(figsize=(12, 6))
plt.plot(df['date'], df['dau'], label='DAU')
plt.plot(df['date'], df['mau'], label='MAU')
plt.legend()
plt.title('用户增长趋势')
plt.savefig('user_growth.png')

最佳实践

数据准确性

  1. 数据校验: 定期核对原始数据
  2. 异常检测: 设置阈值告警
  3. 数据清洗: 处理缺失值和异常值
  4. 版本管理: 记录数据口径变更

报告制作

  1. 明确目标: 报告要解决的问题
  2. 选择指标: 与目标相关的核心指标
  3. 可视化: 选择合适的图表类型
  4. 结论建议: 基于数据给出 actionable 建议

数据安全

  1. 权限控制: 敏感数据脱敏
  2. 访问日志: 记录数据访问
  3. 定期备份: 防止数据丢失
  4. 合规使用: 遵守数据保护法规

需要帮助?

  • 查看 API 文档 了解数据接口
  • 联系数据团队获取定制分析
  • 参加数据分析培训课程