ГлавнаяЛайфстайлПроизводительностьКак использовать Power Query и Power Pivot в Excel как профессионал

Как использовать Power Query и Power Pivot в Excel как профессионал

Если вы хотите стать опытным пользователем электронных таблиц, вам необходимо узнать о функциях Power Query и Power Pivot в Excel. Хотя вы можете многое сделать только с помощью Excel, использование этих встроенных «мощных» функций превратит вас в продвинутого профессионального пользователя Excel. В этом руководстве вы узнаете, как использовать Power Query для импорта сотен различных файлов с миллионами строк и использовать Power Pivot для создания комплексного анализа огромных импортируемых моделей данных.

Хотите защитить свою работу от посторонних глаз? Узнайте, как получить добавить пароль в книгу Excel .

1. Импорт данных из нескольких файлов

Используя Power Query, вы можете импортировать данные из разных файлов в одну папку. Однако будьте внимательны: вы все равно должны убедиться, что все данные имеют один и тот же формат. Сохраняйте количество столбцов и названия заголовков столбцов одинаковыми и убедитесь, что тип данных для значений в каждом столбце единообразен.

В этом руководстве мы используем

Contents

1. Импорт данных из нескольких файлов

tle="пять файлов, которые содержат около 100 миллионов строк данных из Kaggle">пять файлов, которые содержат около 100 миллионов строк данных из Kaggle . Загрузите их, если хотите следовать инструкциям, или используйте свои собственные данные. Учитывая это, вот шаги для импорта данных:

  1. Нажмите на вкладку «Данные» на ленте.
  2. Выберите «Получить данные ->Из файла ->Из папки», затем перейдите к своей папке и выберите ее.
Большие файлы Excel, получение данных

<старый старт="3">

  • Вы должны увидеть всплывающее окно. В нашем случае у нас есть пять тестовых файлов, имена которых соответствуют их размеру: «adult10m» — 10 миллионов строк данных, «adult1m» — 1 миллион строк, «adult100k» — 100 000 строк и так далее. Нажмите «Преобразовать данные», чтобы открыть редактор Power Query.
  • Большие файлы Excel, просмотр папки с данными

    2. Фильтрация импортированных файлов и строк

    В редакторе Power Query вы можете применять фильтры для импорта только тех файлов, которые соответствуют заданным вами критериям, что очень полезно для исключения ненужных источников данных.

    1. У нас есть четыре файла без расширения, но один файл с расширением.DATA. Давайте удалим лишнее, нажав стрелку рядом с надписью «Расширение».
    Расширение редактора Excel Power Query
    1. Мы можем увидеть список всех расширений файлов наших файлов. В этом примере это просто (пусто) и.data. Снимите флажки с ненужных расширений.
    Расширение редактора Excel Power Query снимите флажок с данных
    1. Каждый примененный нами фильтр появится в разделе «Примененные действия».
    2. Мы также можем фильтровать файлы по имени, нажав стрелку рядом с надписью «Имя».
    Имя редактора Excel Power Query
    1. Предположим, мы хотим отфильтровать любые файлы с буквой «k», например «adult100k», потому что мы не хотим работать с небольшими файлами, содержащими менее одного миллиона строк. Мы можем применить текстовый фильтр. Вариантов много, но для наших целей подойдет фильтр «Не содержит».
    Имя редактора Excel Power Query Текстовый фильтр н<h2><span id=2. Фильтрация импортированных файлов и строк который вы не хотите видеть в имени файла.
    Имя редактора Excel Power Query Текстовый фильтр не содержит K
    1. Прокрутите немного вправо, пока не увидите столбцы «Дата изменения» и «Дата создания». Давайте отфильтруем, чтобы выбрать только файлы, созданные в определенном диапазоне времени. Нажмите стрелку рядом с надписью «Дата создания».
    Дата создания редактора Excel Power Query
    1. Выберите «Фильтры даты и времени ->Между».
    Редактор Excel Power Query Дата Фильтр по дате между
    1. Введите значения времени для двух условий и подтвердите, нажав «ОК».
    Редактор Excel Power Query Фильтр даты и даты между 1240 1250
    1. Мы завершили фильтрацию наших данных на уровне файлов.
    2. Давайте объединим оставшиеся файлы, чтобы можно было фильтровать сами данные. Нажмите двойные стрелки рядом с заголовком «Содержимое».
    Редактор Excel Power Query после даты фильтра
    1. Теперь, когда вы можете видеть все значения для отдельных строк, каждая строка имеет дополнительный столбец «Source.Name», который указывает файл, из которого она возникла.
    Имя источника Excel Power Query Крайний левый столбец
    1. Чтобы еще больше улучшить наши данные: поскольку наши файлы CSV изначально поставлялись без названий заголовков столбцов, вы можете щелкнуть правой кнопкой мыши некоторые заголовки столбцов и нажать «Переименовать», чтобы дать им подходящее имя.
    Объединенный редактор Excel Power Query переименован
    1. Фильтры здесь тоже работают. Мы можем применить фильтр диапазона номеров. Например, нажмите стрелку рядом с заголовком столбца «Возраст», затем выберите «Числовые фильтры ->Больше».
    Редактор Excel Power Query Срок действия комбинированного фильтра больше

    <старый старт="14">

  • Введите число, например 30, затем нажмите «ОК». Все строки с возрастом ниже указанного числа будут исключены.
  • Редактор Excel Power Query Возраст комбинированного фильтра старше 30 лет

    Совет : при работе с электронными таблицами в Microsoft Excel может быть полезно знать как переместить столбец .

    3. Загрузка отфильтрованных данных в модель данных

    Вы можете продолжить очистку и фильтрацию данных, но давайте двинемся дальше и загрузим их в модель данных, чтобы начать анализировать их.

    1. Завершите работу с Power Query, нажав «Закрыть и загрузить ->Закрыть и загрузить в».
    2. В открывшемся всплывающем окне выберите «Только создавать соединение» и установите флажок «Добавить эти данные в модель данных».
    Всплывающее окно с данными импорта больших файлов в Excel
    1. Подождите, пока данные загрузятся. Если у вас большой объем данных, это может занять несколько минут.

    Использование модели данных Power Pivot в Excel

    1. После завершения загрузки данных мы можем внести изменения (например, добавить новые столбцы) в модель данных, нажав «Данные ->Инструменты для работы с данными ->Управление моделью данных».
    Лента Excel для больших файлов Перейти к Power Pivot
    1. Вы должны увидеть окно Power Pivot. Давайте добавим столбец с формулой выражений анализа данных (DAX). Формулы DAX очень похожи на формулы Excel, с которыми вы, вероятно, уже знакомы. Прокрутите вправо, пока не увидите последний столбец ваших данных, затем нажмите «Добавить столбец».
    2. Давайте напишем формулу для этого столбца, которая будет применять простые вычисления к каждой строке. По сравнению с формулами Excel синтаксис DAX немного отличается. Например, мы можем добавить столбец «Описание» и ввести формулу =CONCATENATE([Column9],[Column10]). Обратите внимание на использование квадратных скобок ([ ]) и доступ через имена заголовков столбцов.
    Столбец описания больших файлов Excel Power Pivot
    1. При желании вы также можете выполнить дополнительные изменения, например переименовать или удалить столбцы, щелкнув правой кнопкой мыши заголовок столбца.

    4. Анализ данных с помощью сводной таблицы

    После того, как вы закончили вносить изменения в модель данных, пришло время проанализировать данные на листе Excel с помощью сводной таблицы.

    1. Нажмите «Главная ->Сводная таблица» на ленте окна Power Pivot, чтобы открыть окно «Создать сводную таблицу».
    Контекст сводной таблицы Excel Power

    <ол старт="2">

  • Выберите «Новый лист» и нажмите «ОК».
  • Большие файлы Excel Создать сводную таблицу
    1. Панель «Поля сводной таблицы» откроется на новом листе в главном окне Excel. В поле под строкой поиска вы должны увидеть список своих источников данных, в этом примере «kaggle_adult_csv». Нажмите на него, чтобы развернуть и отобразить все столбцы.
    Поля Excel Power Pivot расширяют Kaggle Adult
    1. Давайте проведем анализ и подсчитаем количество каждого «Описания» в наших данных. Мы можем выбрать столбцы, с которыми хотим работать, установив флажок рядом с их именами. Выберите «Описание» и обратите внимание, как фокус автоматически смещается на область «Строки» ниже. Это Power Pivot демонстрирует свой интеллект — он может точно угадать подходящую область для выбора. Поскольку мы начинаем с пустой сводной таблицы, имеет смысл сначала выбрать строки.
    Выбор<h2><span id=3. Загрузка отфильтрованных данных в модель данныхi>Перетащите отмеченный столбец «Описание» в пустое место в разделе «Значения». Обратите внимание, что Power Pivot снова правильно предполагает, что нам нужен «счетчик описаний», поскольку тип данных — текстовый. Кроме того, в нашу таблицу добавлен столбец, в котором указано количество вхождений каждого значения «Описание».
    Количество полей Excel Power Pivot Описание
    1. Мы можем добавить еще одно измерение к нашим подсчетам. Например, перетащите столбец «Возраст» в пустую область «Столбцы», чтобы добавить в таблицу больше деталей, подсчитав количество описаний по каждому возрасту.
    Столбцы возраста поля Excel Power Pivot
    1. Вы также можете добавить в таблицу возможность выбора фильтра, перетащив столбец «WorkClass» в область «Фильтры». Обратите внимание на новую интерактивную ячейку, которая появляется над нашей таб

      Использование модели данных Power Pivot в Excel

      //saintist.ru/wp-content/uploads/2024/05/Excel-Power-Pivot-Field-WorkClass-Filters.jpg" alt="Фильтры рабочих классов полей Power Pivot Excel">
    1. Нажмите стрелку рядом с надписью «Все» и выберите «Никогда не работало». Это изменит таблицу, и в расчеты будут включены только люди с рабочим классом «Никогда не работал». Вы можете изменить фильтр в любой момент, чтобы просмотреть таблицу с другой точки зрения.
    Фильтр полей Excel Power Pivot по рабочему классу

    Имеете дело со многими дубликаты в вашей книге Excel ? Узнайте, как находить и удалять дубликаты, а также очищать таблицы.

    5. Представление ваших данных с помощью PowerChart

    Вы можете создать дополнительные листы для анализа данных различными способами. На этот раз давайте создадим более впечатляющий результат с помощью PowerChart.

    1. Вернитесь в окно «Power Pivot для Excel». Если он закрыт, его можно открыть из окна Excel через «Данные ->Инструменты для работы с данными ->Управление моделью данных».
    2. Нажмите «Сводная таблица ->Сводная диаграмма ->Новый лист».
    Сводная диаграмма Excel Power Pivot
    1. На панели справа нажмите источник данных («kaggle_adult_csv»), чтобы развернуть его и отобразить все его столбцы.
    2. Перетащите столбцы из источника данных в одну из четырех областей ниже, чтобы построить диаграмму. Переместите столбец «Тип профессии» в область «Ось (Категории)».
    Сводная диаграмма Excel, ось типа занятий
    1. Снова перетащите «Тип профессии» и на этот раз в область «Значения». Вы сразу заметите, что гистограмма генерируется автоматически. Он показывает количество каждого типа занятий.
    4. Анализ данных с помощью сводной таблицызанятий сводной диаграммы Excel">
    1. Вы также можете перетащить столбец «Этническая принадлежность» в область «Легенда (серия)». Вы сразу же увидите более подробную диаграмму, в которой сравнивается количество представителей каждой национальности, принадлежащих к каждой профессии.
    Легенда этнической принадлежности сводной диаграммы Excel
    1. Далее мы можем применить фильтры к нашей легенде, чтобы упростить диаграмму и просматривать только определенные значения. Наведите указатель мыши на «Этническая принадлежность», чтобы справа появилась стрелка. Нажмите на стрелку.
    Сводная диаграмма Excel наведите указатель мыши на этническую принадлежность 1
    1. Установите флажки рядом со значениями, которые хотите удалить, оставив только два.
    Сводная диаграмма Excel Фильтры этнической принадлежности
    1. Давайте попробуем что-то новое. В разделе «Значения» нажмите «Количество типов занятий», затем нажмите «Удалить поле». Перетащите столбец «Возраст», чтобы заменить его.
    Сводная диаграмма Excel «Сумма возраста»
    1. Вы заметите, что значение автоматически определяется как «Сумма возраста», но в реальном мире это не очень полезно. Давайте изменим это. Нажмите на него и выберите «Настройки поля значения».
    Настройки поля значения возраста сводной диаграммы Excel
    1. Поскольку возраст — это число, к этому разделу можно применить множество расчетов. Например, попробуйте выбрать «Средний».
    Сводная диаграмма Excel, средний возраст 1
    1. Визуализация обновится и отобразит средний возраст для каждой профессии по определенной этнической принадлежности (которую мы отфильтровали).
    Сводная диаграмма Excel Возраст Средний Визуальный

    Хотите освежить основы Excel? У нас есть подробное руководство по все сочетания клавиш для Excel .

    Часто задаваемые вопросы

    Каково происхождение Power Pivot?

    Microsoft представила Power Pivot как отдельное дополнение , предоставленный Microsoft SQL Server 2008 R2, выпущенный в 2010 году. Тогда он назывался «PowerPivot» без пробела. В 2013 году он был переименован в Power Pivot. Она стала встроенной функцией Excel только в 2016 году.

    Что такое выражения анализа данных и чем они отличаются от формул Excel?

    Выражения анализа данных — это язык формул, используемый Power Pivot в Excel и Power BI. По сути, это то, как вы пишете формулы для вычислений в вышеупомянутых приложениях: используемые операторы, синтаксис и функции.

    Основное преимущество DAX перед формулами Excel заключается в том, что он предназначен для работы с агрегированными данными. Стандартные формулы Excel могут выполнять вычисления построчно (например, вычислять сумму нескольких значений в строке), но формулы DAX могут работать по столбцам (например, подсчитывать количество определенных значений). значение в столбце) или даже во всей таблице.

    Как исправить ошибку «Эта таблица была создана по запросу. Чтобы изменить эту таблицу, измените вместо этого запрос»?

    Эта ошибка в Excel Power Pivot возникает, когда вы пытаетесь изменить модель данных в Power Pivot, когда эта модель данных была первоначально загружена через Power Query. Вы не можете этого сделать, поэтому вам придется изменить его с помощью исходного метода загрузки: Power Query.

    В правой части Excel щелкните значок «Запросы и соединения», затем найдите и дважды щелкните источник данных запроса, чтобы открыть окно, в котором вы можете изменить таблицу.

    Изображение предоставлено: Pexels. Все скриншоты Брэндона Ли.

    5. Представление ваших данных с помощью PowerChart

    Часто задаваемые вопросы

    Каково происхождение Power Pivot?

    Что такое выражения анализа данных и чем они отличаются от формул Excel?

    Как исправить ошибку «Эта таблица была создана по запросу. Чтобы изменить эту таблицу, измените вместо этого запрос»?

    ПОХОЖИЕ СТАТЬИ

    Популярные записи