一、驱虫市场潜力分析
### --- 分析驱虫市场的潜力 import glob import os import pandas as pd import re import numpy as np import datetime as dt from sklearn.linear_model import LinearRegression import seaborn as sns from matplotlib import pyplot as plt import jieba import jieba.analyse import imageio from wordcloud import WordCloud #windows 中文编码 plt.rcParams['font.sans-serif']='simhei' plt.rcParams['axes.unicode_minus']=False sns.set_style("darkgrid",{"font.sans-serif":['simhei','Droid Sans Fallback']}) #mac 中文转码 #plt.rcParams['font.family'] = ['Arial Unicode MS'] #用于正常显示中文标签 #plt.rcParams['axes.unicode_minus'] = False #用于正常显示负号 #sns.set_style('whitegrid',{'font.sans-serif':['Arial Unicode MS','Arial']})
~~~ # 导入数据 os.chdir('/Users/xxs/Desktop/电子商务本文挖掘//电子商务本文挖掘//电子商务本文挖掘/电子商务本文挖掘/data') os.chdir('./驱虫剂市场
### --- 分析目的&加载数据 ~~~ # 分析目的:针对近三年各子类市场的交易量数据, ~~~ # 以及top通过描述性分析,在年变化的维度上: ~~~ 分析整个市场的总体趋势 ~~~ 分析各子类市场份额的变化趋势 ~~~ 分析市场集中度,即是否存在垄断 ~~~ # 分析过程: ~~~ 阅读近三年各子类市场的交易量数据 ~~~ 时间线上各子类交易金额数据按时间汇总成

### --- 清洗&补全数据 ~~~ # 从2015年11月到2018年10月, ~~~ 我们需要的是2016-2018年每月完整的数据(方便从年度变化的角度分析产品) ~~~ # 这里我们假设: ~~~ 每年每月之间都没有明显的周期性变化(近似地认为月与月之间的相关性很小) ~~~ 每年对应月份的数据呈线性变化(一是数据少, ~~~ 二是随着年份的增长,交易量在大环境下稳步变化) ~~~ # 因此,我们可以简单地使用线性回归预测,即对于每个子类市场, ~~~ 11/12月15、16、17年的销售额预测18年的相应月份
### --- 整体市场 ~~~ 根据年份检查驱虫市场的总体变化趋势 ~~~ 各子类市场年交易总额;折线图显示变化 ~~~ 可见,近三年呈增长趋势,整个市场倾向于成长和成熟
### --- 市场变化趋势 ~~~ 检查三年内各类目市场销售总额的变化趋势 ~~~ 直观地看,灭鼠杀虫剂和蚊香液有更大的机会
### --- 各市场占比 ~~~ 检查三年内各类市场销售总额的比例 ~~~ 可见灭鼠剂和蚊香液可进一步扩展, ~~~ 我们需要与甲方业务人员进一步沟通。假设沟通后我们关注的是灭鼠杀虫剂
### --- 市场年增长 ~~~ 16-17年17-18年各类目市场增长率进一步分析 ~~~ 可此可见,除灭鼠杀虫剂和蚊香液增长相对稳定外,其他都有所下降甚至变负
### --- 垄断 ~~~ 垄断或市场力量的重要量化指标是行业集中。 ~~~ 行业集中率是常见指标:CRn赫芬达尔指数(Herfindahl-Hirschman Index,缩写HHI)。
~~~ # 指数范围从1/1/1/N到1, ~~~ 该指数的导数表示该行业等效的公司数量,上一个市场结构相当于1.55521加相同规模的公司。 ~~~ # 范围: ~~~ [1/N,高竞争产业.01],(0.01、不集中行业,0.15], ~~~ (0.15、中等集中.25], (0.高度集中,1] ~~~ # HHI的局限性: ~~~ 行业细分:由于产品分类细化,类别差异大,销售数据可能无法准确判断行业集中度。 ~~~ (比如某大行业各大公司市场份额相同,但业务不同,仍可能导致垄断)。 ~~~ (比如某大行业各大公司市场份额相同,但业务不同,仍可能导致垄断)。 ~~~ # 地理范围: ~~~ 总市场份额相同,但各公司可能在当地造成垄断。 ~~~ # 长尾现象: ~~~ 无限利基市场与大市场竞争(看具体行业)。 ~~~ # 分析流程: ~~~ 使用top100品牌数据通过交易指数反映销售额获得市场份额, ~~~ 描述各品牌的市场份额,计算HHI指标: ~~~ # 计算得到: ~~~ 驱虫市场HHI指数:0.013546(或135.46),等效公司数:73.82。
### --- 市场的潜力分析-结论 ~~~ 整体驱虫市场处于快速增长阶段,趋于从增长期到成熟期 ~~~ 灭鼠杀虫剂市场份额较大(超过60%),约为第二蚊香液的两倍,市场增长率接近40%, ~~~ 可视为明星产品类别,需要持续投资和关注 ~~~ 驱虫市场没有垄断,结构不集中,竞争相对激烈,即大公司没有明显的压力