通常在统计学领域,我们把企业的数据都可以叫商业数据,不管这个数据是来自于市场部门、质量部门、服务部门、供应链部门、研发部门还是人资部门。对应的一门学科就叫商业统计学。基于如上的定义,我们来探索一下数据分析和数据分析体系在不同场景中的应用可能是怎样的?(本文限于篇幅不介绍具体案例,只涉及场景)我们分三个主要的场景来说明。第一个是线下营销场景,使用到商业统计分析的主要是产品怎么组合带来的销售额最大、该给哪些消费者寄礼物和卷能够加大其消费概率、哪里选店最合理、区域销售因素主要是哪些因素决定的、销售预测、折扣多少比例能达到最大销售额/销售利润率、哪些产品的反馈更好、应该开发哪些产品、不同产品在不同区域和人群应该怎么投放/陈列等。第二个是线上场景,在这里使用商业统计分析和机器学习的组合方法较多,包含人群圈选和分类、千人千面的营销策略、推送策略、自然语义相关的评论分析等。第三个是营销管理相关的场景,更多是营销活动费用的最大化投入产出、营销策略的好坏及效果、不同区域的营销策略制定、销售预算的有效性/广告有效性、营销团队的分析。在如上三个主要场景中,牵扯的算法比较多,传统的商业统计分析方法较多,包含假设检验,回归,DoE,机器学习,方差分析,时间序列分析等,使用的工具可以是Excel,JMP,Minitab,Tableau,SPSS,Adobe Analytics等,也可以结合一些SAAS平台的集成工具,比如SAP IBP和CX两个套件里的分析工具,阿里的PAI。具体使用场景要看场景来进行选择。数据分析体系建议主要借用CRISP-DM体系,但是要对商业数据分析建模要有经验,才可以构建出清晰的业务需求。这里我们分为两个主要场景来讲,即一个是偏重于研究和产品开发场景,一个是工艺。在研究和产品开发领域,除了学科领域内的算法,在研发过程中,物理集成/配方的开发、最优组合或参数或者配方对应某一效果/性能/成本/质量/服务/效率的最佳组合、可靠性分析和预测、公差分析、寿命预测等。在工艺场景也类似于研发,比如工艺参数优化、工艺过程控制、工艺开发等。算法上,用到传统的算法比较多,DoE、回归、方差、假设检验等,有特殊场景尤其是比较复杂的超多因素场景,机器学习和神经网络也会有不少应用。在这个部分,常见的数据分析工具有Excel, JMP, Minitab, Matlab, 特殊领域的仿真软件等。数据分析体系建议主要是六西格玛类的体系,在研发端可以使用SPSS体系,在工艺端可以使用经典六西格玛(DMAIC)。对于仓储物流、计划体系等场景,着重可以使用经典的供应链统计学,里面有大量的算法可以使用,包含运筹学等。在这里对于制造型企业并未有太大的突破,更多的是怎么使用好现成的方法和算法,不再赘述。比如对库存控制的领域,经典的供应链统计学中有结合库存逻辑和服务水平(六西格玛)和方差来控制最大库存、最小库存、安全库存的量对应销售预测的波动,也可以做到动态安全库存的控制。对于物流仓储设点,配送等可以使用运筹学方法,也可以使用机器学习的算法,最终实现的都是最短路径/最短时间/最小成本/最XXXX。分析工具层面可以使用Excel, JMP, SPSS以及专用的仓储物流仿真工具和分析工具。在数据分析体系上建议使用六西格玛体系。除了工艺以外,质量、设备、计划排产、精益生产技术、shop floor层面、工厂布局/物流路线、EHS、生产组织方式等方方面面其实都可以使用数据分析,这也是经典六西格玛里面讲的比较多的。比如在质量方面,从制程控制SPC、质量提升、抽样控制、判定好坏、识别影响质量的因素等方面在六西格玛里都有各种分析。在设备方面,这里笔者不建议非设备生产商去研究自己工厂设备的预防性维护,因为设备原理其实是不知道的,而且预防性维护偏重于长期的数据收集及学习,比较成功的更多是旋转型设备。设备领域对于重资产型公司,比如化工行业,可以使用分类算法来进行维护维修的判断和打造专家系统,使用分类算法和其他算法来尽量提高设备的在线率,减少MTBF和MTBR等,提高服务水平以此不影响生产效率和质量。计划排产类的算法大多集成在APS软件里,比如遗传算法。精益生产要跟多的结合六西格玛项目推进效果会更好。在生产组织方式可以使用很多的统计学方法来判断不同生产方式的效率、成本、质量等。分析工具角度用的最多的就是Excel和Minitab, 也有不少是用JMP等。在很多的软件系统里是集成了相应的工具。最常见的就是质量信息系统里集成了SPC等质量相关的统计分析工具。在数据分析体系上建议使用六西格玛体系。除了如上四个大的模块,其他职能也可以充分使用数据分析提高管理水平和效率,减少风险和成本。比如在人资,可以使用统计分析来分析人员结构,薪资结构,不同培训课程的培训效果,人员离职的分类及对策等。在风控领域,更多是看数据的波动和异常,尤其是财务类,这里方差类分析也是有用的,机器学习类比如分类算法也是常用的。甚至在经营和战略层面,我们也可以使用回归和方差等分析来判断预算是否能够产生经营效果,并对未来的销售进行预测。数据分析体系上我们还是建议使用六西格玛体系,这里要说明的六西格玛体系非常适合流程再造,流程效率/出错率改善,在服务型的场景是非常适用的,提高流程效率比如接单评审效率等也是可以做出一番成绩的。采用两级数据分析的虚拟组织通常是大公司的业界最佳实践。● 第一级,即在总部层面或者某一部门内部有行业专家掌握数据分析的能力可以对重大变革项目进行支撑,同时兼任培训培养和提高本组织内的数据分析能力的职能,构建本体系内的数据分析体系、方法论、模型、工具选择等;● 第二级,即全体员工或部分骨干员工,掌握一定的数据分析能力,具有对日常工作运用其数据分析的能力,其在第一级专家所构建的数据分析体系、方法论、模型和选定的工具之下进行操作。比较典型的案例就是六西格玛体系和IPD(集成产品开发)中的DFSS体系。