У меня есть данные о людях, погибших в крушении поезда, и их возрасте.
Например:
file <- data.frame(
Survived = sample(0:1, 100, replace=TRUE),
Age = sample(0:100, 100, replace=TRUE))
Я хотел бы создать гистограмму в R, где каждый бин измеряет количество умерших людей в процентах от общего количества людей в наборе данных, содержащемся в диапазоне бинов.
Вот что у меня есть до сих пор:
hist(file[which(file$Survived==1),]$Age, freq=FALSE)
Но это возвращает только гистограмму со значениями в процентах от всего набора данных. Вот так: Гистограмма образцов данных
Мне нужен процент определенной возрастной группы, чтобы, если бы все люди в возрасте от 0 до 10 умерли, полоса гистограммы была бы на 100% в этой возрастной группе.
splitlist<-split(df, cut(df$ages, seq(0,max(df$ages), by = 20)))
, а затем постройте гистограмму, как предлагает @GyBbarplot(rbind(lapply(splitlist, function(x) 100*sum(x[,"survived"])/nrow(x))))
30.05.2017