#Power Query 分组依据,数据的分类汇总

power,query,分组,依据,数据,分类,汇总 · 浏览次数 : 353

小编点评

**一、概述** Power Query中的分组依据类似于Excel中的分类汇总功能,可以按照某一分类对某列数据或某几列数据进行去重操作和聚合计算。在去重的过程中,可以将其他数据列按照用户指定的方式,对其进行聚合以便生成与依据列相对应的数据。 **二、案例** **2.1 模拟数据源** ``` | 商品 | 地区 | 订单状态 | 门店属性 | 销售金额 | |---|---|---|---|---| | 手机 | 北京 | 已完成 | 购物中心 | 100 | | 电脑 | 上海 | 未完成 | 办公用品店 | 200 | | 手机 | 北京 | 已完成 | 购物中心 | 300 | | 电脑 | 上海 | 未完成 | 办公用品店 | 400 | | 手机 | 北京 | 已完成 | 购物中心 | 500 | ``` **2.2 分组依据界面的介绍及应用** * 选择以商品名为分组条件的新列名:`商品_分组` * 设置聚合操作方法:求和 * 选择以门店属性名为分组条件的新列名:`门店_分组` * 设置聚合操作方法:求和 * 最后输出结果: ``` | 商品 | 地区 | 订单状态 | 门店属性 | 销售金额 | |---|---|---|---|---| | 手机 | 北京 | 已完成 | 购物中心 | 800 | | 电脑 | 上海 | 未完成 | 办公用品店 | 600 | ``` **三、总结** 分组依据可以方便地对数据进行聚合,并根据不同的应用场景,可以选择不同的聚合方法。在实际数据分析中,了解如何进行分组和聚合操作非常重要,可以帮助我们更好地理解和分析数据。

正文

 一:概述

  Power Query中的分组依据,类似于Excel中的分类汇总功能,可以按照某一分类对某列数据或某几列数据进行去重操作和聚合计算(求和、计数、求平均、非重复行计数等),并在去重的过程中将其他数据列按照用户指定的方式,

对其进行聚合以便生成与依据列相对应的数据。在实际工作中,当我们遇到原始数据下沉维度大,导致数据行数过多时,我们也可以考虑通过分组依据,来收缩我们的统计维度。灵活的根据数据需求,去聚合我们的数据,以便后期的

数据分析,是我们处理数据时,必须掌握的一个能力。

二:案例  

下面我们就来举一个例子,来试试分组依据的功能。

2.1  模拟数据源

这是一个虚拟的商品销售表,数据维度有,商品、区域、订单状态、门店属性,以及销售金额。

我们现在有一个目标是需要商品、门店属性下的销售额

 

 2.2  分组依据

首先,需要导入数据源进入pq,这里就不做演示了。

在主页选项卡下,有分组依据按钮,点击即可进入。

 

 2.3  分组依据界面的介绍及应用

 

分组依据:选择以哪个数据列作为分组条件

新列名:用于承载聚合操作结果的新列名名称,自定义命名即可,但不能和现有的列名重复

操作:指定具体的聚合操作方法,主要可选有求和、平均值、中值、最大值、最小值、对行进行计数、非重复行计数以及所有行

柱:指定用于进行聚合计算的数据列,若操作是针对计数,那么柱选项无须填写

这里我们需要统计的是门店属性,商品的销售金额,所以分别对应选择即可。

最后输出下面结果。

 

三:总结

  尽管简单的界面操作,即可完成聚合操作,但是实际的应用中,我们需要对自己的数据源有一定的了解,再进行维度的聚合。根据自己实际的数据需求,去整合数据。

以上就是本次的分享,我是simone,期待下次的相遇。

 

与#Power Query 分组依据,数据的分类汇总相似的内容:

#Power Query 分组依据,数据的分类汇总

一:概述 Power Query中的分组依据,类似于Excel中的分类汇总功能,可以按照某一分类对某列数据或某几列数据进行去重操作和聚合计算(求和、计数、求平均、非重复行计数等),并在去重的过程中将其他数据列按照用户指定的方式, 对其进行聚合以便生成与依据列相对应的数据。在实际工作中,当我们遇到原始

#Powerquery 利用M函数合并文件(CSV、Text、Xlsx)

在日常工作中,我们往往会遇到多个文件需要合并的情况,本文一起探讨一下利用M函数合并文件的案例。 由于需要合并的文件的格式不同,也需要选择不同的M函数来进行合并,本文将分享三个格式的合并案例。 首先介绍一下合并步骤, 1:对新建一个新查询,数据源选择为目标文件的路径。 2:点击转化数据 3:添加一个自

#Powerquery 数据结构基础 一维数据与二维数据

本文参考了采悟老师的文章,推荐大家看原文,本文为笔记随笔 https://mp.weixin.qq.com/s?__biz=MzA4MzQwMjY4MA==&mid=2484068871&idx=1&sn=4ab596602ed0a4c851755673d8fcf37a&chksm=8e0c48d0

#Powerquery pq从入门到精通,笔记梳理

详细视频可以B站搜索,ms_excel博主,看leila的视频翻译课,powerquery从入门到精通。 后续也会根据自己工作来更新这部分的实际用法。

#Python 利用pandas 合并csv/xlsx文件

上次我们分享了利用powerquery来合并文件进行数据分析,但是Pq有一部分局限性,在现实工作中,我们往往需要合并多个文件去处理数据, 如果面对20个甚至更多的文件,pq中的每一步的步骤都会去读取每个文件,运行速度会十分慢,那么有没有简单的解决方法吗? 答案是:可以考虑合并成一个文件后来处理。 我

#Powerbi函数学习 SELECTEDVALUE与ISFILTERED

Power BI中的DAX函数ISFILTERED可以用来判断一个表或者一个列是否被筛选器所影响。 这个函数的语法很简单,就是ISFILTERED(),返回值是TRUE或者FALSE。那么,这个函数有什么用呢?我们来看一个例子。 第一步:数据源和基础度量值

#PowerBi 10分钟学会,以X为结尾的聚合函数

前言 在Power BI中,我们经常需要对数据进行聚合计算,比如求和、求平均、求最大值等。 Power BI提供了一系列的聚合函数,可以用来对表中列的值进行聚合然后返回一个值。这些函数通常只需要一个参数,就是要聚合的列名。如SUM(‘销售表’[销量]),就是求销售表里的销量总和。 但是有时候,我们需

UPS设备在物流机房中的应用浅析

UPS即不间断电源(Uninterruptible Power Supply),是一种含有储能装置的不间断电源。主要用于给部分对电源稳定性要求较高的设备,提供不间断的电源。

[转帖]数据中心常见电源线详细介绍

https://www.cnblogs.com/zhangxinglong/p/14246067.html Power Supply Cord 数据中心常见电源线详细介绍 我们都知道在不同的国家或地区会使用许多不同的插头和插座,当然这里也包括分散在世界各地的数据中心。世界上使用的标准不止一种,不同的

[转帖]什么是 LLVM?Swift, Rust, Clang 等语言背后的支持

https://www.oschina.net/translate/what-is-llvm-the-power-behind-swift-rust-clang-and-more?print 要了解用于以编程方式生成机器原生代码的编译器框架是如何让新语言的推出以及对现有的语言进行增强比以往更加容易了