中国:研究方法

英敏特委托中国具有许可证的专业消费者调查机构——库润数据完成中国系列报告的独家调查取样。在线消费者调查在10个城市抽样,每个城市的样本量为300人,总样本共计3,000人。

  • 我们的消费者研究是基于互联网使用者的随机抽样调查。这些被访者是由中国在线研究机构库润数据选取(详细情况请见下文)。
  • 在每一轮调查中,我们收集4个一线城市的数据,即上海、北京、广州和成都。
  • 对于二、三线及以下城市,我们根据其城市规模和经济发展情况,每次抽取不同的城市进行调查(见下文)。
  • 研究不能代表所有的中国消费者,也不是以此为目的进行分析的。英敏特采用配额抽样的方法,在调查城市中根据消费者年龄、性别和家庭月收入等特性抽取有代表性的样本。
  • 我们的样本数据只能代表这些城市中的都市消费者,而不能代表整个中国的情况。
  • 对于分类报告(例如巧克力糖果),消费者通常会被问及使用情况、消费频率、购买渠道、消费场合、品牌偏好和一系列对于此类别产品的态度和看法。
  • 生活方式报告探究消费者的态度和行为,话题涵盖范围广泛。

显著性检验

从统计学角度而言,根据样本量大小的不同,数据的误差水平仅在+/-2%到3%左右。例如, 如果在1,000个被访者中有20%表示他们会做某件事情,那么在95%的情况下,在总人群中做这件事情的人群比例约为17%-23%左右。当样本量扩大到3,000个时,在95%的情况下,这一百分比约为18%-22%。

所有的调研数据都储存在英敏特的数据库中。若您需要查看报告中没有显示出来的某些分析,我们也可以为您提供。

城市样本大小

当一个城市的总人口数足够多时(>20,000),样本大小不由人口数量决定。只有在人口数量相当少时(比如低于10000),样本大小的计算会受到影响。

所以,在我们的调查中,所有10个城市中的样本大小被定为300。就统计数据而言,这使我们的调查信心水准为95%,误差仅为5.66%。

抽样方法和抽样结构

根据政府数据,中国有645个城市。这些城市的规模大小、经济发展、文化历史和生活方式不尽相同。为了满足英敏特客户的不同关注点(区域、城市大小),我们在每轮调查中根据城市的地理位置和经济发展水平(如国内生产总值、人均收入)选取10个不同的城市进行抽样。下表为所选城市示例:

地区

一线城市

二线城市

三线及以下城市

总数

中国北部 

北京

沈阳

 

2

中国东部 

上海

杭州

金华

3

中国中部 

 

武汉

 

1

中国西部 

成都

   衡阳

2

中国南部 

广州

福州

 

2

总数 

4

4

2

10

注1:上表所列二、三线及以下城市仅为示例

注2:英敏特按以下标准定义划分中国城市的线级:

  • 一线城市:大型经济中心
  • 二线城市:省会城市及经济较发达的非省会城市
  • 三线及以下城市:一、二线以外的其他城市

每个城市的采样结构如下所示:

   

性别和年龄

家庭月收入 (元)

一线城市

总计

男性

20-29

男性

30-39

男性

40-49

女性

20-29

女性

30-39

女性

40-49

6,000-9,999

10,000-17,999

18,000+

北京

300

50

50

50

50

50

50

100

100

100

上海

300

50

50

50

50

50

50

100

100

100

广州

300

50

50

50

50

50

50

100

100

100

成都

300

50

50

50

50

50

50

100

100

100

二、三线及

以下城市

总计

男性

20-29

男性

30-39

男性

40-49

女性

20-29

女性

30-39

女性

40-49

5,000-8,999

9,000-15,999

16,000+

城市 1

300

50

50

50

50

50

50

100

100

100

: : : : : : : : : : :
: : : : : : : : : : :



月收入

我们根据不同城市级别来定义个人月收入及家庭月收入的等级。

  • 对于个人月收入来说:

个人月收入                        一线城市                                               二三线及以下城市

低个人月收入                    人民币 = 2,000 - 5,999                          人民币 = 2,000 - 4,999

中个人月收入                    人民币 = 6,000 - 9,999                          人民币 = 5,000 - 8,999

高个人月收入                    人民币 >= 10,000                                 人民币 >= 9,000

  • 对于家庭月收入来说:

家庭月收入                        一线城市                                               二三线及以下城市

低家庭月收入                    人民币 = 6,000 - 9,999                          人民币 = 5,000 - 8,999

中家庭月收入                    人民币 = 10,000 - 17,999                      人民币 = 9,000 - 15,999

高家庭月收入                    人民币 >= 18,000                                 人民币 >= 16,000

 

我们的研究合作伙伴—库润数据

  • 成立于2006年,总部设在上海,并在北京和广州设有分公司
  • 在线样本规模为5,300,000人(截至2018年12月)
  • 拥有2个被访者互动网站:www.1diaocha.com 和www.votebar.com以及1个微信调研小程序
  • 中国市场研究协会(CMRA)会员,ESOMAR成员
  • 2017年加入ITWP集团,集团内包括Toluna , harrisinteractive等多家知名市场调研公司
  • 每年完成4,000多个项目、累计访问样本量超过2,000,000个
  • 为包括IPSOS、GMI、TNS Lightspeed等大型国际调研公司提供数据,并为Neilsen、Kantar、Intage、Pulse、SSI和ResearchNow等公司提供调研服务。

库润数据的取样和质量控制

1.甄别 - 排除那些

  • 在过去3个月参加过任何调查的被访者
  • 从事任何敏感或相关行业的人员
  • 参与了上一次英敏特调查的被访者
  • 不符合样本条件的参与者
  • 回答问卷的时间低于平均时间者

2.取样

  • 系统将输出所有合格的备选成员
  • 随机抽样30,000名用户,并通过短信或者电子邮件发出第一轮邀请
  • 再次随机抽样30,000名用户,并发出第二轮邀请
  • 最后随机抽样30,000名用户,并发出第三轮邀请

3.质量控制

  • 每一位用户都要向库润数据提供他/她自己的IP地址和所有个人信息
  • 每一位用户都需要使用与注册相同的IP地址和cookie参与任何调查项目,他/她只被允许参加相同的调查一次
  • 每一位被访者只能使用收到的网页链接一次

如果被访者出现下述情况,样本将会被删除

  • 提供低质量的开放性问题答案
  • 没有通过陷阱问题
  • 出现答案不一致或前后矛盾的信息
  • 提供模式固定的答案
  • 花费相当长的时间完成问卷调查
  • 被认定为是一个离群值数据

认识英敏特城市精英人群

为什么要定义“英敏特城市精英人群”?

长久以来,对于如何定义中国“中产阶级”的争论持续不断,涉及收入水平、教育水平和是否拥有某些关键物品的各种计算公式层出不穷,但一直没有得到定论。“中产阶级”的概念大约形成于19世纪的北美和西欧,用于描述21世纪的中国可能早已不合时宜。

英敏特认为,与其简单地套用“中产阶级”这一模糊的概念,应该用一个明确、可行的定义来识别消费者中具有经济实力,并且在消费观上代表了未来趋势的细分人群。为此,英敏特提出了“英敏特城市精英人群”(Mintropolitans) 这个概念,并且列出了一系列的标准用于甄别这群消费者。他们需要同时满足以下四个条件:

  • 他们必须在所居住的城市中拥有较高的收入水平:如果是一线城市,家庭月收入要在18,000元人民币或以上;如果是二、三线及以下城市,家庭月收入要在16,000元人民币或以上。
  • 他们必须接受过高等教育:大学本科或以上。
  • 他们必须拥有房产——无论已还清房贷还是正在还房贷。
  • 最后,他们还需要体现一些消费理念和生活方式的特征,英敏特选择这些标准来衡量人们的消费能力和对生活品质的追求。

概括而言,他们代表一批不仅追求财富还追求生活品质、受过良好教育以及能够引领潮流的成熟消费人群。

他们是谁?

根据英敏特报告所收集的消费者人口统计数据,英敏特城市精英人群在所有受访的城市家庭中的占比为15%,相当于2,700万户家庭人口。

除了具有较高收入以外,英敏特城市精英人群相比其他人群更有可能是30-39岁,已婚已育,拥有研究生学历,以及在外企工作。

深度分析

英敏特运用多样化的定量数据分析技术来提升消费者研究的价值。我们根据每个报告不同的分析需求来使用不同的分析方法。下面是一些我们报告中较为常用的分析方法。

  • 频度分析(Repertoire Analysis)

这个分析方法是根据消费者的行为习惯或者态度来将他们分成不同的细分人群。在调研中,被访者们会从同一个选项列表中选择一个或几个答案。我们将选择了相同选项个数的被访者们集合成一个细分群体(如选择了1个答案个数的被访者作为一个细分人群,选择了2个答案个数的被访者作为另一个细分人群群,以此类推)。所以频度分析就是用来检验选择每个选项个数的被访者占总体人群的比例。举个例子,在关于消费者购买品牌数量的频度分析中,消费者可以被分为购买1-2个品牌者、购买3-4个品牌者、以及购买5个或更多品牌者,这三个不同的细分群体。每个细分群体都有足够大的样本量(即N=75个样本或以上)以供分析。

  • 聚类分析 (Cluster Analysis)

根据被访者在一道或者几道问题上的回答,我们运用这种分析技术将他们细分成不同的“聚类”(cluster)。被分在同一个“聚类”中的样本,在某些测量维度上都具有较为相似的共性。而分在不同“聚类”中的样本,在这些测量维度上,会体现出不同的差异。

  • 对应分析 (Correspondence Analysis)

这种数据可视化方法可以用来描绘一张二维数据表的行(如品牌形象、消费者态度)和列(如品牌、产品、细分人群等)之间的关联性。对应分析生成的图表能用简单易懂的方式展现每个品牌在消费者眼中呈现的形象(和/或消费者对于品牌的态度)。我们运用卡方检验(Chi-square test)来检测不同品牌之间显著性差异,以及不同品牌形象描述语句之间的显著性差异。如果在消费者看来某两个品牌具有相似形象,那么在某些维度上这两个品牌就会具有相近的分数,因此在对应分析图表中,这两个品牌之间的距离就会很近。

  • 决策树分析 (CHAID analysis)

CHAID (Chi-squared Automatic Interaction Detection) 决策树分析是用来发现目标人群的一种分析方法。通过分析样本中哪类细分人群更有可能具备某种特定的性质,从而找出关键目标人群。依据被访者对于某个特定参数的回答结果,这种分析方法将样本一层一层细化为具有相似特性的细分群体,从而帮助我们发现哪些不同的组合将为目标参数提供最大的选中率。例如,在分析哪些不同的人群特征组合会对某些参数有重大影响(如“对于尝试一个新产品感兴趣”)时,我们会使用决策树分析并提供可视化的结果。

  • 关键动因分析 (Key Driver Analysis)

在分析每个因素对于KPI(如满意度、转换品牌的可能性、推荐某个品牌的可能性)的重要程度时,关键动因分析是个非常有用的工具。通过使用相关分析(Correlation Analysis)或回归分析(Regression Analysis),我们能了解哪些因子/特性和某个KPI的良好表现是存在最强相关性或连接度的。借此,我们可以发现对于某个品类,哪些因子/特性更为至关重要,从而保证有限的资源可以被有效利用在最主要的市场动因上。

  • TURF分析 (TURF Analysis)

TURF分析(累积无重复到达率和频次分析)可以找出能吸引最大数量不重复消费者的产品特性、属性或信息的组合。当我们想要覆盖尽可能多的受众,但是产品特性或属性的数量却有限的时候,就可以使用TURF分析。通过分析一个或更多喜欢的产品特性或属性,累积无重复到达率,从而在产品线中找到能最大化渗透的消费者数量。

  • 价格敏感度分析 (Price Sensitivity Analysis)

价格敏感度分析展示了消费者对某种成品的期望价格。消费者被要求为某个成品给出一个价格,根据这些答案得出的累计价格点会被绘制成价格曲线图,用来表示最高心理价位(PME)、最低心理价位(PMC)以及最优价格点(OPP)。

统计模型

英敏特的大多数报告都会使用SPSS统计软件的“多变量时间序列自动回归”统计方法来进行未来五年的统计预测。

这一模型主要基于从英敏特独家市场数据库提取的市场历史数据,并结合各种私有和公共部门机构(例如中国国家统计局和EIU经济学人智库)发布的宏观经济和人口统计数据。

这一模型通过寻找实际市场规模大小和具有高相关性的关键宏观经济及人口统计因素(自变量)间的关系以识别对市场影响力最大的预测因素。

预测中所使用的因素将在相关章节得以详述,并提供这些因素对于所探究的产品需求和市场发展起到什么样的作用。

定性见解

英敏特认为历史性数据对于市场未来走向和状态的决定作用是有限的。所以,行业专家们在市场影响事件方面的真知灼见对我们的超数据模型评估过程弥足珍贵。

因此,英敏特除了使用严格的数据统计程序,还融入了深入的市场知识和专家意见以提供数据预测未覆盖的额外因素和市场状况。

[graphic: image 6]

英敏特扇形图

预测未来的经济走向一直存在着不确定性。为了让我们的客户更好地认识和了解这种不确定性,英敏特推出了扇形图,以这种全新的方式显示市场规模预测。

在历史市场规模和当前年估计的旁边,扇形图显示了未来五年市场价值/总量的各种结果的可能性。

在一个95%的信赖区间,95%的预测结果会落在最大限制值间,我们称之为最好和最差的预测。这些基于统计数据的市场预测是预计将会实现的最高(最好)和最低(最差)的市场规模。

向外扩大的扇形区域相继显示95%、90%、70%和50%概率间隔情况下的市场发展情况。统计数据中央预测会出现在较深阴影区,并有50%的发生概率。

一般性结论:基于我们对于给定历史市场规模数据的认识和我们用于预测的主要宏观和社会经济措施的评估,我们猜想95%的情况下,实际市场规模大小将会是扇形图的紫色阴影区。在所有的情况下,这种模型有5%的可能是不正确的,这是源于随机误差和实际市场规模超出预测范围。

天气类比

为了以一个日常例子说明预测的不确定性,让我们假设以下天气预报是根据气象专家所掌握的过去几天天气情况、大气观测和冷/暖空气前锋等数据做出的。

[graphic: image 4]

  

那么现在,星期六的温度将会是15°C的预测有多准确?我们又有多确定这项预测?

预测中国上海中心星期六的气温将上升到不高不低刚好15°C是可能的,但没有人能100%确定这是会发生的事实。

星期六温度将会介于13°C和17°C是一个更概泛的预测,也更有可能实现。

总的来说,我们可以说根据现有的统计模型,我们95%确定星期六的温度将会在13°C和17°C间,50%确定温度将大约在14.5°C和15.5°C间。 可是,仍然有5%的可能此模型是不正确的,原因是随机误差和星期六的实际温度将不在预计范围内,也就是说温度实际将低于13°C或高于17°C。

(要了解更多有关天气预测不确定性的信息请访问:http://research.metoffice.gov.uk/research/nwp/ensemble/uncertainty.html)