实用网站建设期末考试,广州电商网站开发,学生服务器租用,洛可可设计集团Excel和Python#xff0c;作为数据分析的主流工具#xff0c;在从效率提升到数据商业化的整个过程中#xff0c;都起到了重要作用。不管是在Excel中通过鼠标点选实现#xff0c;亦或是利用Python通过代码实现#xff0c;数据分析中的很多基础功能都是相通的。
在数据量级大…
Excel和Python作为数据分析的主流工具在从效率提升到数据商业化的整个过程中都起到了重要作用。不管是在Excel中通过鼠标点选实现亦或是利用Python通过代码实现数据分析中的很多基础功能都是相通的。
在数据量级大跃进的今天对于从业者来说熟练掌握用于数据处理的编程语言非常必要通晓两者可以更增竞争力。而借助大家最为熟悉的Excel操作对照学习相应的Python实现可以帮助更快理解轻松掌握。
都说Excel关键要掌握4个核心函数vlookupifsumsumif和1个核心功能数据透视表本期我们就聚焦在广受喜欢的数据透视表和VLOOKUP的操作。
数据透视表
使用数据透视表可以快速汇总数据进而进行进一步的分析。
例如对于一张简单的家庭开支列表可以基于该列表制作数据透视表1.Excel实现
使用数据透视表在“插入”——“数据透视表”选中需要创建数据透视表的数据。
我们可以看到如下界面上半部分为数据透视表中的所有字段下半部分为数据透视表的选项把上方的字段拖入下方对应框中即可完成数据透视表。
这里使用2018年国内上市公司管理层报酬统计数据为例以“公司行业”为行标签“公司组织形式”为列标签对“年度报酬总额(万元)”数据计算平均数得到如下分类汇总和聚合计算。2.Python实现
Python中数据透视表的实现原理与Excel类同使用pandas库中的pivot_table()方法。data要进行数据透视表操作的DataFrame对象
values要进行值计算的列对应Excel操作中“数值”框
index行索引对应Excel操作中“行标签”框
columns列名对应Excel操作中“列标签”框
aggfunc设定对values要进行的计算类型
fill_value对空值的填充值
margins是否显示合计列
dropna是否删除缺失值
margins_name设置合计列的列名当然我们可以进行更多灵活操作如对各类别的“前三名高管报酬总额”求中位数对“年度报酬总额”求均值这种对不同的值进行不同类型计算可以通过aggfunc传入字典键为列名值为计算方式来设定。VLOOKUP
实际工作中我们经常会需要用到查找功能VLOOKUP很多时候是Excel用户学习的第一个查找函数也是Excel最常使用的三个函数之一被称为Excel中的效率之王。它应用非常广泛比如可以将多表匹配、合并达到对比、查漏等效果甚至前段时间新诞生的xlookup也借着它的大名火了一把。
例如在如下信息表中我们可以查找到与ID号102完全匹配的姓氏进行返回。
1.Excel实现
VLOOKUP这个名称中v为vertical竖直的意思lookup即为查找它实现的是纵向按列查找返回该列所需查询序列所对应的值。
函数表示
即VLOOKUP(你想要查找的内容, 要查找的范围, 包含要返回的值的区域中的列号, 返回近似或精确匹配)
这里我们继续使用2018年国内上市公司管理层报酬统计数据需要查找指定的10家上市公司名称、年度报酬总额、前三名董事报酬总额及前三名高管报酬总额。在Excel中就可使用VLOOKUP函数实现如L2的名称数据是以J2为要进行查找的关键字查找范围为A2:H3594返回列数为2表示查找范围的第2列即“名称”匹配模式为FALSE表示精确匹配而得到。
2.Python实现
Python中有多种方法可以实现该操作推荐使用pandas库中的merge()函数它是全功能、高性能的连接操作在习惯上非常类似于SQL等关系数据库。left参与合并的左侧DataFrame
right参与合并的右侧DataFrame
how合并方式为innerouterleftright其中之一
on用于连接的列名必须存在于左右两侧数据
left_on左侧DataFrame中用作连接键的列
right_on右侧DataFrame中用作连接键的列
left_index将左侧的行索引用作其连接键
right_index将右侧的行索引用作其连接键
sort根据连接键对合并后的数据进行排序通过how进行设置的合并方法主要取决于merge操作的目的
若只需要查找到指定的10家上市公司数据则可采用左连接以放在左侧的avgs数据为基准
若主要想对右侧salary数据中的3593家上市公司管理层报酬数据进行分析仅是将已有的员工人均薪酬数据加入则可考虑使用右连接
若想保留同时出现在左右两侧的数据则可考虑使用内连接取键的交集
若想将左右两侧数据都进行保留则可考虑使用外连接取键的并集。除了使用on指定连接键我们也可将代码设置为index通过index作为连接键进行匹配