Arhn - архитектура программирования

Публикации по теме 'pandas'


Статистические функции панд
Хорошо разбирайтесь в своих данных. Pandas - это широко используемая библиотека Python для обработки и анализа данных. Он предоставляет множество методов и функций, которые ускоряют этапы анализа данных и предварительной обработки. Кроме того, pandas также предоставляет статистические функции, которые можно использовать для дальнейшего понимания данных. В этом посте мы начнем с простой описательной статистики, а затем представим еще несколько сложных статистических функций панд. Как..

Глубокое погружение в режим копирования при записи панд — часть II
Объяснение того, как копирование при записи оптимизирует производительность Введение В первом посте объяснялось, как работает механизм копирования при записи. В нем выделены некоторые области, где копии вводятся в рабочий процесс. В этом посте основное внимание будет уделено оптимизации, которая гарантирует, что это не замедлит средний рабочий процесс. Мы используем технику, которую используют внутренние компоненты pandas, чтобы избежать копирования всего DataFrame, когда в..

30 SQL-запросов, объясненных через их эквиваленты Pandas
SQL стал намного проще для людей, которые любят Pandas Мотивация В мире, где с 1974 года доминирует SQL, в 2008 году появился Pandas, предлагающий привлекательные функции, такие как встроенная визуализация и гибкая обработка данных. Он быстро стал популярным инструментом для исследования данных, затмив собой SQL. Но не обманывайтесь, SQL по-прежнему держит свои позиции. Это второй по востребованности и третий по скорости роста язык для науки о данных (см. здесь ). Таким образом,..

Вопросы по теме 'pandas'

Рекомендации по пакету Python для анализа данных и обучения
Я хочу создать аналитическую систему поверх платформы для публикации статей. В частности, я хочу отслеживать поведение пользователей при чтении (например, количество просмотров статьи, время, проведенное с открытой статьей, рейтинг и т. д.), а также...

Заполнение последней записью группы
Скажем, у меня есть следующий кадр данных: > df C D E A B bar one -1.350006 0.260339 2 three -0.236451 -0.056614 0 flux six -0.515571 -0.155078 1 three -0.365032...
17.12.2023

Добавление списка в начало вывода Pandas DataFrame
У меня есть следующий текстовый файл в качестве входных данных ( infile.txt ) A foo 3.0 A bar 3.1 B foo 3.0 B bar 3.1 И со следующим кодом import pandas as pd infile="infile.txt" df = pd.io.parsers.read_table(infile,header=None,sep=" ")...
02.10.2023

Преобразование одной строки DataFrame в плоский список
Я новичок в Python, и поэтому у меня возникают проблемы с преобразованием строки в DataFrame в плоскую list . Для этого я использую следующий код: Игрушка DataFrame : import pandas as pd d = { "a": [1, 2, 3, 4, 5], "b": [9, 8, 7,...
03.12.2023

dask dataframe как преобразовать столбец в to_datetime
Я пытаюсь преобразовать один столбец моего фрейма данных в datetime. После обсуждения здесь https://github.com/dask/dask/issues/863 Я пробовал следующий код: import dask.dataframe as dd df['time'].map_partitions(pd.to_datetime,...
03.10.2023

python pandas – ввод значений в новый столбец
У меня есть небольшой кадр данных ниже расходов на 4 человека. Существует пустой столбец под названием «Оценка». Я хотел бы оценить тех, кто потратил более 100 долларов, на оценку A и оценку B для тех, кто потратил менее 100 долларов. Каков...
18.11.2023

Вложенный ответ JSON на CSV Python
Я искал несколько часов для решения, но ни одно из них не подходило для моего случая. Я новичок на этом форуме и последние несколько недель изучаю Python. Любая обратная связь очень приветствуется. Я получаю следующий ответ JSON от API QPX...
29.11.2023

применение панд, вырезанных внутри группы
Я пытаюсь создать ячейки (A_bin) в DataFrame на основе одного столбца (A), а затем создать уникальные ячейки (B_bin) на основе другого столбца (B) в каждой из исходных ячеек. df = pd.DataFrame({'A': [4.5, 5.1, 5.9, 6.3, 6.7, 7.5, 7.9, 8.5, 8.9,...
29.10.2023

Мин., Макс., Средняя продолжительность Время csv
Я пытаюсь вычесть два столбца в CSV, чтобы создать третий столбец "Продолжительность" Время окончания - Время начала Каждая строка также соответствует идентификатору пользователя. Я могу создать CSV-файл только с столбцом «Длительность», но...
01.11.2023

Объедините два фрейма данных в группу с помощью GroupBy
У меня есть два кадра данных, и мне нужно объединить их на основе даты, но объединение должно выполняться для каждой группы ( participant_id ) отдельно. df1: response_date summary epis_mark participant_id 0 2012-01-04 0.0...

Настройка подграфиков круговых диаграмм с соответствующим размером и интервалом
Я изо всех сил пытаюсь настроить подграфики круговой диаграммы с подходящим размером и интервалом. Если размер круговой диаграммы слишком мал, данные не видны, если расстояние между подграфиками не подходит, диаграмма будет переполнена. Таким...

Добавить рабочий лист в существующий файл Excel с пандами
# Set the working folder to the same folder as the script os.chdir(os.path.dirname(os.path.abspath(__file__))) test = send_request().content df = pd.read_csv(io.StringIO(test.decode('utf-8'))) writer = pd.ExcelWriter('NHL_STATS_JSB_final.xlsx', \...
01.12.2023

Векторизованный поиск значений столбца фрейма данных Pandas в отдельном списке
Я ищу быстрый (векторизованный) способ выполнения вычислений с использованием содержимого фрейма данных Pandas. Мой фрейм данных содержит 2 метки для каждой строки, и я хочу найти значения, соответствующие каждой метке (из словаря/списка), и...

Как сохранить исходный индекс DataFrame после группировки по 2 столбцам?
Есть ли способ сохранить исходный индекс моего большого фрейма данных после выполнения groupby? Причина, по которой мне это нужно, заключается в том, что мне нужно выполнить внутреннее слияние с моим исходным df (после моей группы), чтобы...

подсчет строк с использованием фрейма данных pandas
У меня есть кадр данных pandas с данными временной метки. Я хочу подсчитать, сколько строк у меня есть в минуту, например, с учетом этой таблицы: 00:00:01 данные1 00:00:21 данные2 00:02:02 данные3 00:02:10 данные4 00:02:31 данные5...

Панды Сравнение почасовых данных за несколько лет на одном графике
Итак, у меня есть фреймворк pandas, называемый годом, в этой форме: discharge (m^3/s) date 2016-01-01 00:00:00 17.6930 2016-01-01 01:00:00...
13.10.2023

Как проверить, пуст ли dask dataframe
Есть ли даск-эквивалент функции pandas empty ? Я хочу проверить, пуст ли фрейм данных dask, но df.empty возвращает AttributeError: 'DataFrame' object has no attribute 'empty'
22.10.2023

Как создать dict dicts с помощью файла csv
Я хотел бы создать словарь с ключом, являющимся первой строкой CSV-файла, и значением, являющимся словарем {первый столбец: соответствующий столбец для строки} Например, test.csv Header1, Header2, Header3 A, 1, 10 B, 2, 20...

Разделите один кадр данных на другой, не учитывая один столбец
У меня есть два фрейма данных: df1: Produtos Jan Feb Mar Apr May Jun \ 0 100 15884.0 8194.0 41070.0 8294.0 17308.0 18146.0 1 10057 0.0 0.0 0.0 24900.0...

Сравнение двух фреймов данных pandas в столбце и строке
У меня есть два фрейма данных pandas, которые выглядят примерно одинаково, но с разной информацией, хранящейся в них. Мой вопрос будет о том, как сравнить два фрейма данных, чтобы гарантировать совпадение столбца и строки перед выполнением некоторого...

Новые материалы

Коллекции публикаций по глубокому обучению
Последние пару месяцев я создавал коллекции последних академических публикаций по различным подполям глубокого обучения в моем блоге https://amundtveit.com - эта публикация дает обзор 25..

Представляем: Pepita
Фреймворк JavaScript с открытым исходным кодом Я знаю, что недостатка в фреймворках JavaScript нет. Но я просто не мог остановиться. Я хотел написать что-то сам, со своими собственными..

Советы по коду Laravel #2
1-) Найти // You can specify the columns you need // in when you use the find method on a model User::find(‘id’, [‘email’,’name’]); // You can increment or decrement // a field in..

Работа с временными рядами спутниковых изображений, часть 3 (аналитика данных)
Анализ временных рядов спутниковых изображений для данных наблюдений за большой Землей (arXiv) Автор: Рольф Симоэс , Жильберто Камара , Жильберто Кейрос , Фелипе Соуза , Педро Р. Андраде ,..

3 способа решить квадратное уравнение (3-й мой любимый) -
1. Методом факторизации — 2. Используя квадратичную формулу — 3. Заполнив квадрат — Давайте поймем это, решив это простое уравнение: Мы пытаемся сделать LHS,..

Создание VR-миров с A-Frame
Виртуальная реальность (и дополненная реальность) стали главными модными терминами в образовательных технологиях. С недорогими VR-гарнитурами, такими как Google Cardboard , и использованием..

Демистификация рекурсии
КОДЕКС Демистификация рекурсии Упрощенная концепция ошеломляющей О чем весь этот шум? Рекурсия, кажется, единственная тема, от которой у каждого начинающего студента-информатика..