当前位置：和泉文库 > 计算机 > 浏览文档

复旦大学：《数据挖掘实用案例分析》课程教学资源（PPT课件讲稿）第7章海底捞火锅运营分析

• 火锅相关数据抓取 • 数据预处理 • 数据分析 – 海底捞运营分析 – 店铺选址分析 • 菜品关联分析 • 用户评论和评分的关联分析 • 顾客情感分析

文件格式：PPTX，文件大小：2.55MB，售价：12元

文档详细内容（约58页）

数据预处理处理后评分数据口味评分服务评分环境评分评价月份评价均分(数字)用户贡献值(数字) 口味4非常好)服务4非常好)环境3很好)04 口味4非常好)服务4(丰常好)环境3很好)04 口味4非常好)服务4(非常好)环墳4非常好)04 口味4非常好)服务4(非常好)环墳4非常好)045 口味4非常好)脶务4(非常好)环墳4非常好)04 4 口味4非常好)服务4(非常好)环境4非常好)04 口味3很好)服务3(很好)环墳3很好)04 口味4(非常好)脶务4(非常好)环墳3(很好)04 口味4非常好)服务4(非常好)环境4非常好)04 口味4非常好)服务4(非常好)环境4非常好)04 口味4非常好)服务4(非常好)环境4非常好)04 味4丰常好)服务4丰常好)环3很好)045

数据预处理 • 处理后评分数据

数据预处理菜品内容原始数据 12-17草原上的趨滑牛肉鴨血柠檬水豆浆金针菇鲜血手切羊肉 06-29爱吃饭的F滑牛肉一根面海底捞笋片午餐肉鸭肠虾滑鱼片捞面 316-12-16 LY ZyTo鹈血虾滑嫩牛肉鱼片 416-12-12时光溅落鸭肠小料鲜毛肚 516-11-11小糊涂_姿一根面滑牛肉滑牛肉海底捞牛肉 216100楼,转库虾弄生无更鱼共脸花 3910和12携斜片角毛海拜毛里H豌豆尖自助小科龙利鱼片海携血旺鸭舌头巴沙鱼 1016-0911挪若岩2豆浆豆皮手切羊肉鲜虾滑竹笋鸳盎锅青笋西式牛滑山药黑豆浆茼落鸭肠毛肚羊F 1116-09-10嗜血如兰 216-0907一帆杰作滑牛肉一根面海底捞牛肉海底捞笋片嫩牛肉虾滑 1316-09-07努力的向E滑牛肉一根面海底捞牛肉鸭血毛肚 1416-0904Jay小颖一根面嫩牛肉虾滑 -n-11飞飞扬的hs生肉t柚而只生肉濫牛肉t(忖轺好)

数据预处理 • 菜品内容原始数据

数据预处理统计每种菜品出现的次数 #!/usr/bin/python #→ codingutf-8 获取推荐数较多的菜品 word lst=D with open( /meal. txt,)as wf, open("word. txt",w,)as wf2 word Ist append(word split()) for item2 in item if item2 not in word dict: word dict item2=1 word dict [item2 ] += I final dict=sorted(word dict items, key=lambda item: item[1], reverse=True) for x, y in final dict wf2 write(str(x)+"+ stry)+"n

数据预处理 • 统计每种菜品出现的次数 • 获取推荐数较多的菜品 #!/usr/bin/python # -*- coding:utf-8 -*- word_lst = [] word_dict = {} with open('./meal.txt') as wf， open("word.txt"， 'w') as wf2: for word in wf: word_lst.append(word.split(' ')) for item in word_lst: for item2 in item: if item2 not in word_dict: word_dict[item2] = 1 else: word_dict[item2] += 1 final_dict = sorted(word_dict.items()， key=lambda item: item[1]， reverse=True) for x，y in final_dict: wf2.write(str(x) + " " + str(y) + "\n")

数据预处理选取推荐数大于10 的菜进行关联分析 #要输出的表格将每一个菜名设 sheet I =workbook add sheet('sheetI', cell overwrite ok-true) 置为新的表格的列 #读取统计的词频 Fopen('/word.txt','r, encoding'UTF-8 名称 f close #添加第一行的菜品名 while num len( content) if int( mealCountp=10#选择数量大于10的菜品 ntent(num Content(num J Otem neet 1. write(0, write Num, content num mealTup-meaITup(contentnum),)

数据预处理 • 选取推荐数大于10 的菜进行关联分析，将每一个菜名设置为新的表格的列名称 import xlwt import xlrd #要输出的表格 workbook=xlwt.Workbook() sheet1 = workbook.add_sheet(‘sheet1’，cell_overwrite_ok=true) #读取统计的词频 f=open(‘./word.txt’，’r’，encoding=’UTF-8’) content=f.readlines() f.close() #添加第一行的菜品名 num=0 writeNum=0 while num < len(content) tem = content[num].find(‘’) mealCount=content[num][tem:-1]#商品数量 if int(mealCount)>=10:#选择数量大于10的菜品 content[num]=content[num][0:tem] sheet1.write(0，writeNum，content[num]) mealT up=mealTup+(content[num]，) writeNum+=1 num+=1

数据预处理读取抓取的“菜品 #读取抓取的数据 s”中的每一用 workbook1= xrd. open_workbook(/菜品xsx') 户的推荐菜,若列 worksheets=workbook1sheet_ names 名称中的菜出现在 worksheet1 workbook1. sheet _by_name(u'其余的评价 num rows=worksheet nrows 该用户的推荐菜中 for curr_row in range(num_rows) ,则将对应的单元 roW= worksheet1 row values( curr row)#每一行 mealFlag=0 格设为1,否则设为 while meal Flag<len(mealTup mealName=mealTup[meal] 0 row index(mealName) sheet1. write(curr_row+ 1, mealFlag, 1) except: sheet1. write(curr_row+ 1, meal Flag, 0) nealFlaq+=1 workbook save(meal×s’)

数据预处理 • 读取抓取的“菜品 .xlsx”中的每一用户的推荐菜，若列名称中的菜出现在该用户的推荐菜中，则将对应的单元格设为1，否则设为 0 #读取抓取的数据 workbook1=xlrd.open_workbook(‘./菜品.xlsx’) worksheets=workbook1.sheet_names() worksheet1=workbook1.sheet_by_name(u’其余的评价’) num_rows=worksheet1.nrows for curr_row in range(num_rows): row=worksheet1.row_values(curr_row)#每一行 mealFlag=0 while mealFlag<len(mealTup): mealName=mealTup[mealFlag] try: row.index(mealName) sheet1.write(curr_row+1,mealFlag,1) except: sheet1.write(curr_row+1,mealFlag,0) mealFlag+=1 workbook.save(‘meal.xls’)

点击进入文档下载页（PPTX格式）

共58页，可试读20页，点击继续阅读 ↓↓

您可能感兴趣的文档

复旦大学：《数据挖掘实用案例分析》课程教学资源（PPT课件讲稿）第6章银行信用卡欺诈与拖欠行为分析
复旦大学：《数据挖掘实用案例分析》课程教学资源（PPT课件讲稿）第5章香水销售分析
复旦大学：《数据挖掘实用案例分析》课程教学资源（PPT课件讲稿）第4章 SPSS Modeler介绍
复旦大学：《数据挖掘实用案例分析》课程教学资源（PPT课件讲稿）第3章可视化的分析
复旦大学：《数据挖掘实用案例分析》课程教学资源（PPT课件讲稿）第2章保险产品推荐（主讲：赵卫东）
复旦大学：《数据挖掘实用案例分析》课程教学资源（PPT课件讲稿）第1章数据分析过程的主要问题
复旦大学：《数据挖掘实用案例分析》课程教学资源（PPT课件讲稿）第11章卷积神经网络在音频质量评价领域的应用
复旦大学：《数据挖掘实用案例分析》课程教学资源（PPT课件讲稿）第10章基于逻辑回归模型的高危
中国科学院计算技术研究所：《高级人工智能》PPT课件_贝叶斯网络——概率推理（史忠植）
复旦大学：《商务智能》课程PPT教学课件（商务数据分析）序列模式挖掘算法
复旦大学：《商务智能》课程PPT教学课件（商务数据分析）密度聚类——算法详解
复旦大学：《商务智能》课程PPT教学课件（商务数据分析）关联规则 CARMA Continuous Association Rule Mining Algorithm
复旦大学：《数据挖掘实用案例分析》课程教学资源（PPT课件讲稿）第8章商务宾馆竞争分析
复旦大学：《数据挖掘实用案例分析》课程教学资源（PPT课件讲稿）第9章耐热导线工厂质量管理数据分析
《商务智能：数据分析的管理视角 Business Intelligence, Analytics, and Data Science：A Managerial Perspective》教学资源（PPT课件，第3版）Chapter 01 An Overview of Business Intelligence, Analytics, and Decision Support
《商务智能：数据分析的管理视角 Business Intelligence, Analytics, and Data Science：A Managerial Perspective》教学资源（PPT课件，第3版）Chapter 02 Data Warehousing
《商务智能：数据分析的管理视角 Business Intelligence, Analytics, and Data Science：A Managerial Perspective》教学资源（PPT课件，第3版）Chapter 03 Business Reporting, Visual Analytics, and Business Performance Management
《商务智能：数据分析的管理视角 Business Intelligence, Analytics, and Data Science：A Managerial Perspective》教学资源（PPT课件，第3版）Chapter 04 Data Mining
《商务智能：数据分析的管理视角 Business Intelligence, Analytics, and Data Science：A Managerial Perspective》教学资源（PPT课件，第3版）Chapter 05 Text and Web Analytics
《商务智能：数据分析的管理视角 Business Intelligence, Analytics, and Data Science：A Managerial Perspective》教学资源（PPT课件，第3版）Chapter 06 Big Data and Analytics
《商务智能：数据分析的管理视角 Business Intelligence, Analytics, and Data Science：A Managerial Perspective》教学资源（PPT课件，第3版）Chapter 07 Business Analytics：Emerging Trends and Future Impacts
《商务智能：数据分析的管理视角 Business Intelligence, Analytics, and Data Science：A Managerial Perspective》教学资源（PPT课件，原书第4版）03 Descriptive Analytics II：Business Intelligence and Data Warehousing
《商务智能：数据分析的管理视角 Business Intelligence, Analytics, and Data Science：A Managerial Perspective》教学资源（PPT课件，原书第4版）04 Predictive Analytics I：Data Mining Process, Methods, and Algorithms
《商务智能：数据分析的管理视角 Business Intelligence, Analytics, and Data Science：A Managerial Perspective》教学资源（PPT课件，原书第4版）05 Predictive Analytics II：Text, Web, and Social Media Analytics …

点击购买下载（PPTX）

下载及服务说明

购买前请先查看本文档预览页，确认内容后再进行支付；
如遇文件无法下载、无法访问或其它任何问题，可发送电子邮件反馈，核实后将进行文件补发或退款等其它相关操作；
邮箱：

文档浏览记录