Правый / левый комок
У меня есть набор данных длиной 15 000 с реальными значениями от 0 до 100. Мой набор данных сильно наклонен влево. Я пытаюсь выполнить следующие ячейки: 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, >10. То, что я сделал до сих пор, создало следующее:
breakvector = c(0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 100)
и побежали:
hist(datavector, breaks=breakvector, xlim=(0, 13))
Однако, похоже, что это приводит к гистограмме, где данные больше 13 не включены. Кто-нибудь имеет какие-либо идеи о том, как получить R для бина все остальные данные в последнем бине. Заранее спасибо.
1 ответ
Решение
Как насчет этого
datavector<-c(sample(1:9, 40, replace=T), sample(10:100, 20, replace=T))
breakvector <- c(0:11)
hist(ifelse(datavector>10,11,datavector), breaks=breakvector, xlim=c(0, 13), xaxt="n")
axis(1, at=1:11-.5, labels=c(1:10, ">10"))
Вместо того, чтобы корректировать разрывы, я просто выбрасываю все значения >10
в корзину для 11. Затем я обновляю ось соответственно.