Я использую пакет dtwclust
для классификации данных временных рядов. Я много играл с ним, используя одномерные данные, и выяснил его входы и выходы. Использование многомерных данных документировано немного хуже, но мне удалось заставить его работать с помощью DTW и иерархической кластеризации. Когда я пытаюсь использовать DTW и групповую кластеризацию, функция построения графика возвращает предупреждение, а сам график довольно непонятен. То же самое и с примерными данными, которые они цитируют в справочном руководстве:
# Multivariate series, provided as a list of matrices
mv <- CharTrajMV[1L:20L]
# Using GAK distance
mvc <- tsclust(mv, k = 4L, distance = "gak", seed = 390,
args = tsclust_args(dist = list(sigma = 100)))
# Note how the variables of each series are appended one after the other in the plot
plot(mvc)
Warning messages:
1: In data.frame(dfm, do.call(rbind, dfm_tcc)) :
row names were found from a short variable and have been discarded
2: In data.frame(dfcm, do.call(rbind, dfcm_tc)) :
row names were found from a short variable and have been discarded
Похоже, что под линиями добавляется заливка, которая не добавляется в одномерном случае. Серии также не являются «добавленными один за другим», что мне до сих пор неясно, что именно это означает.
Прежде чем я сообщил об этом как об ошибке на Github, я надеялся, что кто-то с опытом может объяснить, что я могу делать неправильно здесь.