场景:数据整理与分析
本文介绍如何使用代班友友进行数据处理和分析任务。
场景概述
适用情况:
- 数据清洗和格式转换
- 统计分析和趋势挖掘
- 数据可视化准备
- 业务报表生成
输出成果:
- 📊 处理后的数据文件(CSV/JSON)
- 📈 分析报告(Markdown)
- 📉 图表说明文档
- 💻 数据处理脚本
预计耗时: 3-10分钟
操作步骤
第一步:描述数据任务
需求模板
我有一份【数据类型】数据,需要:
数据来源:【数据描述或样本】
分析目标:
- 【目标1】
- 【目标2】
- 【目标3】
输出要求:
- 【格式要求】
- 【可视化需求】
- 【报告要求】
实际示例1:数据清洗
我有一份销售数据(CSV格式),需要清洗和分析:
数据样本:
日期,产品,销售额,区域
2024-01-01,产品A,12500,华东
2024-01-01,产品B,8900,华北
...
任务:
1. 数据清洗:
- 去除重复记录
- 处理缺失值
- 统一日期格式
2. 数据分析:
- 各区域销售额统计
- 产品销量排行
- 月度增长趋势
- 同比环比分析
3. 输出:
- 清洗后的数据(CSV)
- 分析报告(Markdown)
- 统计图表说明
实际示例2:业务分析
分析过去12个月的用户增长数据,生成分析报告。
需要分析:
- 每月新增用户数
- 用户留存率
- 用户来源渠道效果
- 增长最快的月份和原因
输出:
- 增长趋势图说明
- 渠道对比分析
- 结论和建议
- 数据表格(JSON)
第二步:AI处理过程
任务分解
📋 数据理解阶段
☑ 解析数据格式
☑ 识别数据字段
🔍 数据处理阶段
🔄 数据清洗
☐ 数据转换
☐ 统计计算
☐ 趋势分析
📊 可视化准备阶段
☐ 生成图表数据
☐ 编写图表说明
📝 报告生成阶段
☐ 撰写分析报告
☐ 整理结论建议
第三步:查看分析结果
分析报告
文件名: sales_data_analysis_report.md
# 销售数据分析报告
## 数据概况
- **数据时间范围**:2024年1月 - 2024年9月
- **总记录数**:2,847条
- **产品数量**:15个
- **覆盖区域**:6个大区
## 数据质量
### 清洗前
- 重复记录:127条(4.5%)
- 缺失值:35条(1.2%)
- 异常值:8条(0.3%)
### 清洗后
- 有效记录:2,677条
- 数据完整性:100%
- 数据质量评分:98/100
## 销售趋势分析
### 整体趋势
2024年1-9月销售总额:¥38,450,000
| 月份 | 销售额(万元) | 环比增长 | 同比增长 |
|------|--------------|---------|---------|
| 1月 | 350 | - | 15% |
| 2月 | 320 | -8.6% | 12% |
| 3月 | 420 | 31.3% | 25% |
| 4月 | 480 | 14.3% | 30% |
| 5月 | 510 | 6.3% | 28% |
| 6月 | 550 | 7.8% | 35% |
| 7月 | 490 | -10.9% | 20% |
| 8月 | 520 | 6.1% | 22% |
| 9月 | 560 | 7.7% | 38% |
**关键发现:**
1. ✅ 整体呈上升趋势,月均增长约6%
2. 📈 3月和6月为销售高峰
3. 📉 7月出现回调,可能受季节影响
4. 🚀 9月同比增长38%,表现突出
### 区域分析
各大区销售额占比:
| 区域 | 销售额(万元) | 占比 | 增长率 |
|------|--------------|------|--------|
| 华东 | 1,250 | 32.5% | 45% |
| 华南 | 890 | 23.1% | 35% |
| 华北 | 720 | 18.7% | 28% |
| 西南 | 450 | 11.7% | 15% |
| 华中 | 380 | 9.9% | 20% |
| 东北 | 155 | 4.0% | 8% |
**区域洞察:**
- 💪 华东区表现最佳,贡献1/3销售额
- 🌟 华南区增速快,潜力大
- ⚠️ 东北区增长乏力,需重点关注
### 产品分析
TOP 5 产品销售排行:
1. **产品A** - ¥680万(17.7%)
- 主力产品,各区域表现均衡
2. **产品C** - ¥520万(13.5%)
- 高端产品,华东华南受欢迎
3. **产品E** - ¥450万(11.7%)
- 新品表现亮眼,增速60%
4. **产品B** - ¥420万(10.9%)
- 经典款,稳定贡献
5. **产品D** - ¥380万(9.9%)
- 中端主力,性价比高
**产品建议:**
- 加大产品E的推广投入
- 优化产品B的营销策略
- 考虑淘汰低销量产品(<2%)
## 数据可视化
### 图表1:月度销售趋势
描述:折线图,横轴为月份,纵轴为销售额 特点:整体上升,3月和6月为峰值
### 图表2:区域销售占比
描述:饼图,展示各大区占比 亮点:华东区占比超1/3
### 图表3:产品销量排行
描述:横向柱状图,TOP 10产品 对比:前5名占总销售额64%
## 结论与建议
### 主要结论
1. 📊 销售态势良好,同比增长约25%
2. 🗺️ 区域发展不均衡,东部强西北弱
3. 🏆 头部产品贡献显著,长尾效应明显
4. 📅 存在明显季节性波动
### 行动建议
#### 短期(1-3个月)
1. 🎯 加强华南、西南市场投入
2. 🚀 推广新品产品E,扩大市场份额
3. 📢 7-8月淡季做促销活动
#### 中期(3-6个月)
1. 🔄 优化产品组合,淘汰低效产品
2. 🌐 拓展东北市场,寻找增长点
3. 📊 建立实时数据监控系统
#### 长期(6-12个月)
1. 💡 开发适合各区域特色的产品
2. 🤝 建立区域独家代理体系
3. 📈 设立年度销售目标:增长35%
---
**报告生成时间**:2025-10-10
**数据来源**:销售系统导出数据
**分析工具**:代班友友AI
数据文件
1. 清洗后的数据
文件名: sales_data_cleaned.csv
日期,产品,销售额,区域,销售员,数量
2024-01-01,产品A,12500,华东,张三,50
2024-01-01,产品B,8900,华北,李四,35
2024-01-02,产品C,15600,华南,王五,40
...
2. 统计结果
文件名: sales_statistics.json
{
"summary": {
"total_sales": 38450000,
"avg_monthly_sales": 4272222,
"growth_rate": 0.25,
"best_month": "2024-09",
"best_region": "华东",
"best_product": "产品A"
},
"monthly_data": [
{
"month": "2024-01",
"sales": 3500000,
"mom_growth": null,
"yoy_growth": 0.15
},
...
],
"regional_data": [
{
"region": "华东",
"sales": 12500000,
"percentage": 0.325,
"growth": 0.45
},
...
]
}
数据处理类型
类型1:数据清洗
任务示例:
清洗Excel销售数据:
- 去除空行和重复项
- 统一日期格式(YYYY-MM-DD)
- 处理缺失的区域字段
- 修正异常的销售额(负数或超大值)
- 标准化产品名称
类型2:格式转换
任务示例:
将JSON数据转换为CSV表格:
- 扁平化嵌套结构
- 选择需要的字段
- 添加计算列(如增长率)
类型3:统计分析
任务示例:
分析用户行为数据:
- 计算DAU/MAU
- 用户留存率分析
- 行为漏斗转化率
- 用户分群统计
类型4:趋势预测
任务示例:
基于历史数据预测未来3个月销售:
- 时间序列分析
- 趋势线拟合
- 考虑季节性因素
- 给出预测区间
最佳实践
✅ 数据准备
- 提供数据样本
数据样本(前5行):
姓名,年龄,部门,工资
张三,28,技术部,15000
李四,32,市场部,12000
...
- 说明数据含义
字段说明:
- 日期:交易发生日期
- 销售额:单位为元
- 区域:销售大区(6个)
- 指明问题
数据质量问题:
- 部分日期格式不统一
- 存在重复订单
- 约5%的记录缺少区域信息
💡 分析要求
明确分析维度:
需要分析:
1. 时间维度:日/周/月趋势
2. 空间维度:各区域对比
3. 产品维度:品类销量
4. 同比环比:增长情况
指定可视化需求:
需要的图表:
- 月度趋势折线图
- 区域占比饼图
- 产品销量条形图
- 增长率对比柱状图
实际案例
案例1:用户行为分析
用户需求:
分析APP用户行为数据,包含10万条记录:
- 用户注册时间
- 登录频次
- 功能使用情况
- 付费转化
生成用户画像和行为报告。
AI输出:
- 📊 用户行为分析报告
- 📈 用户分群结果(JSON)
- 🎯 精准营销建议
- 📉 流失用户特征分析
案例2:财务数据汇总
用户需求:
汇总12个月的财务数据:
- 收入、成本、利润
- 各部门费用明细
- 预算执行情况
- 同比分析
生成财务分析报告和可视化图表说明。
AI输出:
- 📊 财务分析报告
- 📈 三大报表(损益、现金流、资产负债)
- 💰 预算对比分析
- 📉 成本结构分析
常见问题
Q1: 可以上传数据文件吗?
A: 当前需要在对话中提供数据样本或描述。未来可能支持文件上传。
Q2: 数据量有限制吗?
A: 建议提供数据样本(前10-100行)和总体描述。大数据集建议下载脚本后本地处理。
Q3: 能生成可执行的分析脚本吗?
A: 可以!请求:
请生成Python数据分析脚本,包含完整的处理流程。
Q4: 可视化图表是真实图片吗?
A: AI生成图表的文字描述和数据。您可以:
- 使用描述在Excel/BI工具中创建
- 要求AI生成图表代码(如Python Matplotlib)
相关场景
用代班友友,快速完成数据分析任务! 📊
