Arhn - архитектура программирования

pandas split-apply-combine создает нежелательный MultiIndex

Я использую шаблон split-apply-combine в пандах, чтобы сгруппировать мой df с помощью пользовательской функции агрегации. Но это возвращает нежелательный DataFrame с сгруппированным столбцом, существующим дважды: в MultiIndex и столбцах.

Ниже приведен упрощенный пример моей проблемы.

Скажем, у меня есть этот дф

df = pd.DataFrame([[1,2],[3,4],[1,5]], columns=['A','B']))

   A  B
0  1  2
1  3  4
2  1  5

Я хочу сгруппировать по столбцу A и сохранить только те строки, где B имеет четное значение. Таким образом, желаемый df таков:

   B
A        
1  2
3  4

Пользовательская функция my_combine_func должна выполнять фильтрацию. Но применение его после groupby приводит к MultiIndex с прежним индексом на втором уровне. Таким образом, столбец A существует два раза.

my_combine_func = group[group['B'] % 2 == 0]

df.groupby(['A']).apply(my_combine_func)

     A  B
A        
1 0  1  2
3 1  3  4

Как применить функцию пользовательской группы и получить желаемый df?


Ответы:


1

Здесь проще использовать apply, чтобы получить логический массив:

df[df.groupby('A')['B'].apply(lambda x: x % 2 == 0)]

   A  B
0  1  2
1  3  4
22.11.2020
Новые материалы

Коллекции публикаций по глубокому обучению
Последние пару месяцев я создавал коллекции последних академических публикаций по различным подполям глубокого обучения в моем блоге https://amundtveit.com - эта публикация дает обзор 25..

Представляем: Pepita
Фреймворк JavaScript с открытым исходным кодом Я знаю, что недостатка в фреймворках JavaScript нет. Но я просто не мог остановиться. Я хотел написать что-то сам, со своими собственными..

Советы по коду Laravel #2
1-) Найти // You can specify the columns you need // in when you use the find method on a model User::find(‘id’, [‘email’,’name’]); // You can increment or decrement // a field in..

Работа с временными рядами спутниковых изображений, часть 3 (аналитика данных)
Анализ временных рядов спутниковых изображений для данных наблюдений за большой Землей (arXiv) Автор: Рольф Симоэс , Жильберто Камара , Жильберто Кейрос , Фелипе Соуза , Педро Р. Андраде ,..

3 способа решить квадратное уравнение (3-й мой любимый) -
1. Методом факторизации — 2. Используя квадратичную формулу — 3. Заполнив квадрат — Давайте поймем это, решив это простое уравнение: Мы пытаемся сделать LHS,..

Создание VR-миров с A-Frame
Виртуальная реальность (и дополненная реальность) стали главными модными терминами в образовательных технологиях. С недорогими VR-гарнитурами, такими как Google Cardboard , и использованием..

Демистификация рекурсии
КОДЕКС Демистификация рекурсии Упрощенная концепция ошеломляющей О чем весь этот шум? Рекурсия, кажется, единственная тема, от которой у каждого начинающего студента-информатика..