# pandas_final **Repository Path**: EmmaLui/pandas_final ## Basic Information - **Project Name**: pandas_final - **Description**: 数据分析课程的期末作业,数据来源是公司的系统,导出了公司饭堂中某个餐饮的消费数据,可以拟一个该餐厅的周年庆方案 - **Primary Language**: Unknown - **License**: Not specified - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 1 - **Forks**: 0 - **Created**: 2021-07-02 - **Last Updated**: 2022-06-21 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README # Pandas_final # 介绍 数据分析课程的期末作业,数据来源是公司的系统,导出了公司饭堂中某个餐饮的消费数据,可以拟一个该餐厅的周年庆方案 # 一、项目名称 通过分析后台系统的消费数据,提出捆绑销售的价格建议,并为牛肉面店家的周年庆活动提供策划思路以及数据支撑,增强牛肉面店家“暖胃也暖心”的品牌形象,最后给出消费(结账)场景下更好收集详细数据的建议 # 二、问题表述 我个人很喜欢吃公司饭堂的牛肉面,物美价廉,不仅最想吃的大漠烤肉下架了,而且还很害怕牛肉面店家因为经营不善不再于公司续约;结合本人可以获得牛肉面店家在我司的消费数据,在牛肉面店家进驻公司一周年之际,计划帮牛肉面店家拟一个周年庆活动,用较少的成本增强牛肉店家“暖胃也暖心”的品牌形象,提高牛肉面店家与其他餐厅的竞争力,并且指出牛肉面店家在消费(结账)场景下收集数据时还可以完善细分的地方,以便日后更好地进行产品搭配,提高组合式套餐的利润以及食客满意度。 # 三、解决方案表述 这个项目通过公司后台系统获取数据,然后使用python的pandas、math和matplotlib库,进行简单的数据分析,通过Viability商业可行性、Feasibility技术可行性、及Desirability用户可欲性的分析,产出了两项周年庆方案、一个数据收集建议和一个应对疫情的建议,并提供数据流程图作为参考。两项周年庆方案、一个数据收集建议和一个应对疫情的建议具有最小可行性实践的可能性,试错成本低,容错率高。 ## (1)数据分析思路及方法 ### 思路: 1. 思考自己的权限内可以获得哪些数据,哪些数据涉及员工隐私,哪些数据是不需要的; 2. 从自身感受出发,思考自己愿意做哪些权限内的数据分析,完成了该数据分析对自己有何好处,满足了被分析方的什么需求; 3. 思考自己的权限能否帮助被分析方实现分析得出的结果; 4. 思考代码怎么敲才能实现自己想要的效果 ### 方法: #### 1.可以获得的数据是公司卡机的消费数据,其中包含: - 人员编号 - 姓名 - 部门名称 - 卡号 - 卡账号 - 类型名称 - 操作金额(元) - 余额(元) - 消费类型 - 餐厅 - 餐别 - 设备序列号 - 设备流水号 - 卡流水号 - 消费时间 - 上传时间 - 记录标志 - 操作员 ![后台](https://images.gitee.com/uploads/images/2021/0703/215947_c2fbf05d_2232118.png "WechatIMG458.png") ##### 1.1 删除涉及隐私的部分: - 姓名 ![删除姓名](https://images.gitee.com/uploads/images/2021/0703/220116_1d205e0c_2232118.png "WechatIMG459.png") ##### 1.2. 删除不需要的数据: - 卡账号 - 类型名称 - 余额(元) - 消费类型 - 餐厅 - 餐别 - 设备序列号 - 设备流水号 - 卡流水号 - 上传时间 - 记录标志 - 操作员 ![删除不需要的数据](https://images.gitee.com/uploads/images/2021/0703/215801_636b2975_2232118.png "WechatIMG457.png") #### 2.1 选择这家餐厅是出于情感考虑,也就是对这家餐厅的偏爱 #### 2.2 结合现有的代码知识,我可以对数据进行统计、求平均值、产出可视化图表 #### 2.3 - **2.3.1 我的职位主要工作范围是员工福利,帮助该店家进行数据分析不仅可以强化自身的数据思维以及代码水平,还可能让商家进行优惠营销活动,进而帮助企业员工争取到餐饮福利;** - **2.3.2 希望店家在数据分析调整运营后,可以考虑把我还没吃过的大漠烤肉重新上架;** - **2.3.3 让店家取得更高的盈利** #### 2.4 [代码文件](https://gitee.com/EmmaLui/pandas_final/blob/master/%E6%9C%9F%E6%9C%AB%E4%BD%9C%E4%B8%9A.ipynb) ## (2)数据分析流程及成果 ### 1. 数据分析流程 通过DVF模型进行分析,并罗列出清晰的数据流程 #### 1.1DVF模型 ##### 用户需求: 1. 店家从未举办过营销活动,疫情影响下餐厅销售额下跌,需要营销活动进行刺激; 2. 公司员工的总人数变动不会太大,店家需要提高自身竞争力从而吸引更多的员工消费; ##### 技术可行性: 1. 商家只能掌握总额,我能掌握商家所不掌握的消费数据,并且进行数据分析; 2. 建议的营销方案产生的成本较低; ##### 可持续性: 1. 建议的营销方案具备可复制性,作为周年庆活动,可以在经营良好的情况下陆续使用; 2. 可更好地、不断地完善店家的销售手法,进而实现更理想的盈利,继而获取更有价值的数据和更强的餐饮竞争力,形成良性循环。 ![DFV](https://images.gitee.com/uploads/images/2021/0703/004410_96eb1069_2232118.png "IMG_2053.PNG") #### 1.2数据流程图DFD ![DPD](https://images.gitee.com/uploads/images/2021/0703/005727_f5b3056c_2232118.png "后台系统.png") ### 2. 成果 #### 2.1 推荐设定套餐价格搭配在18元 通过计算 **_每个人的消费总额的平均值、每个人的消费总额的平均值的中位数、每个人的消费总额的平均值的众数、所有人的平均消费价格、所有人消费价格的中位数、所有人消费价格的众数_** ,得出来的价格范围在16~18.85之间,其中,整数为18的数据出现的比例更是高达80%。结合一碗牛肉面的单价在15元,其他单项产品只有茶叶蛋小于3元,我建议推出套餐组合,并且价格定位在18元左右,通过设定食客所广泛接受的套餐价格,来捆绑销售自身的产品, **降低库存压力,提高食材的流通性,进而进一步降低食材损耗率** 。 ![18元](https://images.gitee.com/uploads/images/2021/0703/212042_cbdd6477_2232118.png "IMG_2087.PNG") #### 2.2 周年店庆方案 ##### 2.2.1 周年店庆方案一:给全公司总消费额最高的10名员工免单单人消费组合 通过计算 _**每个员工的消费总额,并且按照消费总额由大到小排序,最后取出总消费额最高的10名员工的名单**_ ![1-10免单](https://images.gitee.com/uploads/images/2021/0703/213148_86d5b009_2232118.png "WechatIMG450.png") ###### 方案一优点: 1. **成本低:** 只需要免单10个人的单人消费,费用不高 2. **执行难度低:** 只需要和行政部门对接该方案的宣传,跨部门协作少,也符合行政部门和员工福利相关的利害相关,协作方的合作意愿强 ###### 方案一缺点: 1. **宣传力度弱:** 只给10个人免单,不能引起公司大部分员工的关注,显得略微吝啬 2. **容易出现个别员工已经离职的风险:** 显得更加吝啬 ##### 2.2.2 周年店庆方案二:给全公司每个部门中总消费额最高的员工免单单人消费组合 通过按照 **_以部门为单位进行分组,计算部门内每个人的消费总额,再以部门为单位进行进行大到小的排序_** ![1](https://images.gitee.com/uploads/images/2021/0703/214151_121b7f84_2232118.png "WechatIMG451.png") ![2](https://images.gitee.com/uploads/images/2021/0703/214202_b5083c4f_2232118.png "WechatIMG452.png") ###### 方案二优点: 1. **宣传力度高:** 涉及公司所有部门,大家都会下意识去关注 ###### 方案二缺点: 1. **成本高:** 涉及公司所有部门,费用较方案一高了不少 2. **执行难度低:** 不仅需要和行政部门对接该方案的宣传,而且还要和人力资源部对接各部门人员的通知,跨部门多,并且不符合人力资源部门的利害相关,协作方的合作意愿较方案一低 #### 2.3 节假日和疫情的冲击情况 通过统计 **_每月的营业额_** 并产出 **_可视化图片_** ![3](https://images.gitee.com/uploads/images/2021/0703/214808_0aee73d8_2232118.png "WechatIMG453.png") ![4](https://images.gitee.com/uploads/images/2021/0703/214819_30e7b40a_2232118.png "WechatIMG454.png") 通过数据我们可以得知,牛肉面店家在正常情况下的月营业额都在10w以上,但是10月份的国庆假期和2月份的春节会让营业额有明显的下滑,下滑后又有缓步上升的趋势,这是 **正常的季度性规律,不用过于担心。** 但是2021年6月份由于广州疫情的复发,番禺区禁止堂食,让该月的营业额呈现 **断崖式下跌** 。根据本人了解,该店并没有主动去和对接的行政部门寻求外卖或员工送餐上的合作。不知是出于何种考虑,这都是不利于盈利的做法。随着广州堂食的缓和,建议店家应该着重考虑如何应对下一个无法堂食时期带来的冲击,制度若干个对应方案,降低运营风险,减轻现金流压力。 #### 2.4 消费(结账)场景下的数据搜集建议 基于我的了解,由于未知原因,我(公司)可以获得的数据和商家是一样的,这意味着商家只能了解自己某个时间段的消费总额,并不能快捷地透过数据得到具体某个产品的销量反馈,也无法更好地利用 **数据的相关性** ,进而迭代或组合自己家的产品。鉴于这种情况,我给牛肉面店家提出以下建议: 1. 增设内部数据搜集机器,在食客消费的时候记录对方选择了哪些产品,对具体产品的选择数据进行收集; 2. 用符合协作方公司(我方)利害相关的做法,反过来要求协作方给你们升级数据/消费系统,并且按照特定周期给予数据反馈。 # 四、学习/实践心得总结及感谢 首先很感谢公司饭堂里有这么好吃的牛肉面,让我有这个分析动力——我真的太喜欢吃了,我希望他们家生意越来越好,永远不要倒闭;其次感谢公司给了我获取他们消费数据的权限,巧妇难为无米之炊,没有数据,就分析不成。通过本次实践,我不仅增强了代码能力,还对数据分析的实操有了深刻的认识:比起分析的技巧,解决问题才是更为重要的,我们完全可以用着简单的方法解决问题,不管黑猫白猫,能抓老鼠就是好猫;我还意识到,不是所有的数据都有价值,我们不需要太多的数据,我们需要有价值的数据;我更是意识到,比起数据分析,数据的搜集和清洗尤为重要,我们应该在前期——数据收集时期就做好这类的准备,减轻后期的工作量。 感谢智超老师在这门课上对我们代码的教导,让我拥有了更多敢于去编程的自信;感谢和我一起完成期中作业的19级小伙伴,你们让我这个18级加选生少了孤单和彷徨;感谢帮我录制直播的小伙伴,让我在远程也能接收到代码的洗礼。