Arhn - архитектура программирования

Расчет процентного изменения с течением времени с помощью набора продольных данных

Я пытаюсь рассчитать годовое изменение некоторых данных, которые у меня есть. Он в панельной/продольной форме

данные находятся в кадре данных, который выглядит так

Year    ZipCode     Value
2011    11411         5
2012    11411         10
2013    11411         20
2011    11345         6
2012    11345         7 
2013    11345         10

Я хотел бы получить фрейм данных, который выходит в такой форме

Year Differnce    Zipcode    % Change
2011-2012         11411        100%
2012-2013         11411        100%
2011-2012         11345        16%
2012-2013         11345        42%

  • Это был хороший вопрос, почему он был отредактирован, чтобы ввод и вывод не соответствовали? 16.07.2019
  • Сорри, это была ошибка. Откат 16.07.2019

Ответы:


1

Одним из способов использования dplyr является вычисление Change путем вычитания текущего Value из предыдущего Value и paste из Year вместе для каждого ZipCode.

library(dplyr)

df %>%
  group_by(ZipCode) %>%
  mutate(Change = (Value - lag(Value))/lag(Value) * 100, 
         Year_Diff = paste(lag(Year), Year, sep = "-")) %>%
  slice(-1) %>%
  select(Year_Diff, ZipCode, Change)

#  Year_Diff ZipCode Change
#  <chr>       <int>  <dbl>
#1 2011-2012   11345   16.7
#2 2012-2013   11345   42.9
#3 2011-2012   11411  100  
#4 2012-2013   11411  100  
16.07.2019

2

Используя data.table, мы группируем по «ZipCode», берем diff из «Значения», делим на скорректированную длину «Значения», а paste объединяем соседний «Год» вместе.

library(data.table)
setDT(df1)[, .(Change  = 100 *diff(Value)/Value[-.N], 
    Year_Diff = paste(Year[-.N], Year[-1], sep="-")),  .(ZipCode)]
#    ZipCode    Change Year_Diff
#1:   11411 100.00000 2011-2012
#2:   11411 100.00000 2012-2013
#3:   11345  16.66667 2011-2012
#4:   11345  42.85714 2012-2013

данные

df1 <- structure(list(Year = c(2011L, 2012L, 2013L, 2011L, 2012L, 2013L
), ZipCode = c(11411L, 11411L, 11411L, 11345L, 11345L, 11345L
), Value = c(5L, 10L, 20L, 6L, 7L, 10L)), class = "data.frame", 
row.names = c(NA, 
-6L))
16.07.2019
Новые материалы

Коллекции публикаций по глубокому обучению
Последние пару месяцев я создавал коллекции последних академических публикаций по различным подполям глубокого обучения в моем блоге https://amundtveit.com - эта публикация дает обзор 25..

Представляем: Pepita
Фреймворк JavaScript с открытым исходным кодом Я знаю, что недостатка в фреймворках JavaScript нет. Но я просто не мог остановиться. Я хотел написать что-то сам, со своими собственными..

Советы по коду Laravel #2
1-) Найти // You can specify the columns you need // in when you use the find method on a model User::find(‘id’, [‘email’,’name’]); // You can increment or decrement // a field in..

Работа с временными рядами спутниковых изображений, часть 3 (аналитика данных)
Анализ временных рядов спутниковых изображений для данных наблюдений за большой Землей (arXiv) Автор: Рольф Симоэс , Жильберто Камара , Жильберто Кейрос , Фелипе Соуза , Педро Р. Андраде ,..

3 способа решить квадратное уравнение (3-й мой любимый) -
1. Методом факторизации — 2. Используя квадратичную формулу — 3. Заполнив квадрат — Давайте поймем это, решив это простое уравнение: Мы пытаемся сделать LHS,..

Создание VR-миров с A-Frame
Виртуальная реальность (и дополненная реальность) стали главными модными терминами в образовательных технологиях. С недорогими VR-гарнитурами, такими как Google Cardboard , и использованием..

Демистификация рекурсии
КОДЕКС Демистификация рекурсии Упрощенная концепция ошеломляющей О чем весь этот шум? Рекурсия, кажется, единственная тема, от которой у каждого начинающего студента-информатика..