世界杯球队分析_worldcupshootouts.csv-CSDN博客

admin 阅读:31 2024-04-04 01:28:33 评论:0
世界杯球队分析_worldcupshootouts.csv-CSDN博客

  在世界杯⚽️期间,想起一个主题,根据往年的球队信息,进行一些分析,如果可以预测今年球队名次更佳(ὠ;美滋滋Ὂ; )。

  如果你更感兴趣各种emoji表情的内容,也可以通过emoji官网找到对应的代码,python中也提供了对应的emoji库。

  世界杯球队分析:

  kaggle上世界杯的数据集

  kaggle相关分析参考

  CSDN上热门球队夺冠分析

  数据分析阶段参考:https://baijiahao.baidu.com/s?id=1750933727392335087

  本数据集来源于kaggle,CSDN的下载地址为https://download.csdn.net/download/m0_38139250/87231076:

  数据集下包含3个文件,分别是:

  该数据集包括从1872年第一场正式比赛到2022年的44152场国际足球比赛结果。比赛范围从国际足联世界杯到国际足球联合会野生杯,再到普通的友谊赛。这些比赛严格来说都是男足国际比赛,数据不包括奥运会或至少有一支球队是国家b队、U-23或联赛精选球队的比赛。

  数据集截图:

  results.csv数据集的字段含义如下:

  date - date of the match 比赛日期

  home_team - the name of the home team 主队名称

  away_team - the name of the away team 客队名称

  home_score - full-time home team score including extra time, not including penalty-shootouts 主队进球数 (不含点球)

  away_score - full-time away team score including extra time, not including penalty-shootouts 客队进球数 (不含点球

  tournament - the name of the tournament 比赛的类型

  city - the name of the city/town/administrative unit where the match was played 比赛所在城市

  country - the name of the country where the match was played 比赛所在国家

  neutral - TRUE/FALSE column indicating whether the match was played at a neutral venue 比赛是否在中立场地进行

  数据集截图:

  shootouts.csv 点球大战数据集 包含如下的字段:

  date - date of the match 比赛日期

  home_team - the name of the home team 主场球队名称

  away_team - the name of the away team 客场球队名称

  winner - winner of the penalty-shootout 点球大战的胜利者

  关于球队和国家名称:

  主队和客场队都使用了球队当前的队名。例如,1882年,一支自称爱尔兰的球队与英格兰队比赛,在这个数据集中,它被称为北爱尔兰,因为现在的北爱尔兰队是1882年爱尔兰队的继承者。这样做是为了更容易跟踪团队的历史和统计数据。

  对于国家名称,使用比赛时的国家名称。所以当加纳在20世纪50年代在黄金海岸的阿克拉比赛时,尽管主队和国家队的名字并不匹配

  数据分析时,如果选择有效的切入点呢,一般而言,多维度分析是切实可行的方法。

  多维度分析实质是细分分析,多维度分析对精细化运营的作用非常重要。多维度分析主要基于两个地方展开,一个是指标的细化,一个是维度的多元,比如时间维度,竞品维度等。管理层通常看的是综合指标,总值。但是这些总值无法真正发现问题。而运营通常需要根据具体的、细分的数据来支撑决策。比如从用户角度看,每天访问用户100万,每天购买的用户1万,但这100万个用户是通过什么渠道知道平台的,在平台哪个模块停留时间长,哪个模块转化率高需要通过指标细分,才能下结论。 3.2.1 导入模块

  3.2.2 导入数据 1.遍历目录

  输出为:

  os.walk()函数参考链接 2.读取数据

  3.2.3 查看描述数据 1.查看数据

  查看前5条

  输出为:

  查看数据类型等信息

  输出为:

  2. 获取所有世界杯比赛的数据

  输出为:

  3. 查看包含FIFA的类型

  输出为:

  4. 获取世界杯数据不包含预选赛

  输出为:

  5. 数据转化时间类型

  转换时间格式,生成新的年份数据

  输出为:

  6.计算进球得分数据

  输出为:

  7. 根据得分数据构造赢球字段

  输出为:

  3.2.4 获取世界杯主场比赛的比赛结果分析 1.查看空缺值

  输出为:

  2.删除空缺值

  3.添加主场胜负平列

  输出为:

  4. 获取世界杯主场比赛的比赛结果分析

  输出为:

  可视化分析

  输出为:

  针对这些数据,还可以进行其它分析,看你的创意啦~~~

  在研究数据时,可以遵循以下几个方向:

  1.谁是有史以来最好的球队

  2.哪些球队统治着不同的足球时代

  3.历史上国际足球的发展趋势是什么——主场优势、总进球数、球队实力分布等等

  4.我们能从足球赛程中谈谈地缘政治吗?国家的数量是如何变化的?哪些球队喜欢彼此比赛

  5.哪些国家举办的比赛最多,而他们自己却不参加

  6.举办一场大型赛事对一个国家的世界杯机会有多大帮助

  可以针对这份数据集,进行如下操作:

  1.使用爬虫获取csdn中的下载数据

  2.加载数据

  3.数据处理

  4.数据分析

  5.数据可视化

  6.数据挖掘预测,预测今年谁是冠军吧

本文 zblog模板 原创,转载保留链接!网址:https://www.kfbvip.com/post/2651.html

可以去百度分享获取分享代码输入这里。
声明

1.本站遵循行业规范,任何转载的稿件都会明确标注作者和来源;2.本站的原创文章,请转载时务必注明文章作者和来源,不尊重原创的行为我们将追究责任;3.作者投稿可能会经我们编辑修改或补充。

发表评论
搜索
排行榜