1. Ускорение машины обучения подпространств с помощью оптимизации роя частиц и параллельной обработки(arXiv)

Автор: Хунъюй Фу, Ицзин Ян, Юхуай Лю, Джозеф Лин, Итан Харрисон, Винод К. Мишра, К. -С. Джей Куо

Аннотация. Недавно было предложено создать машину подпространственного обучения (SLM), основанную на идее классификации дерева решений (DT) и регрессии, чтобы обеспечить более высокую производительность в задачах общей классификации и регрессии. Повышение его производительности достигается за счет более высокой вычислительной сложности. В этой работе мы исследуем два способа ускорения SLM. Во-первых, мы используем алгоритм оптимизации роя частиц (PSO), чтобы ускорить поиск размерности дискриминанта, которая выражается как линейная комбинация текущих измерений. Поиск оптимальных весов в линейной комбинации требует больших вычислительных ресурсов. Это осуществляется путем вероятностного поиска в исходной SLM. Ускорение SLM с помощью PSO требует в 10–20 раз меньше итераций. Во-вторых, мы используем параллельную обработку в реализации SLM. Экспериментальные результаты показывают, что ускоренный метод SLM достигает коэффициента ускорения 577 во время обучения, сохраняя при этом производительность классификации/регрессии, сравнимую с оригинальной SLM.

2.Оптимизированный и распараллеленный порядок обработки для улучшенной частотно-селективной экстраполяции сигнала(arXiv)

Автор:Юрген Зайлер, Андре Кауп

Аннотация: В последние годы многоядерные процессоры нашли применение во многих вычислительных устройствах. Чтобы наилучшим образом использовать возможности таких устройств, алгоритмы обработки сигналов должны быть адаптированы к работе в параллельных задачах. В этом вкладе предлагается оптимизированный порядок обработки для частотно-селективной экстраполяции, мощного алгоритма экстраполяции сигнала. Используя этот оптимизированный порядок, экстраполяцию можно проводить параллельно. Алгоритм очень хорошо масштабируется, что приводит к ускорению до 7,7 раза для восьмиядерного компьютера. Кроме того, оптимизированный порядок обработки направлен на уменьшение распространения ошибок экстраполяции на последовательные потери. Таким образом, в дополнение к ускорению может быть достигнуто визуально заметное улучшение качества до 0,5 дБ PSNR.

3.Конфигурация совместного кластера для распределенной параллельной обработки данных: обзор исследования(arXiv)

Автор:Лауриц Тамсен, Доминик Шейнерт, Джонатан Уилл, Джонатан Бадер, Одей Као

Аннотация: многие организации регулярно анализируют большие наборы данных, используя системы для распределенной параллельной обработки данных и кластеры стандартных ресурсов. Тем не менее, пользователям необходимо настроить адекватные ресурсы для своих заданий по обработке данных. Для этого требуется глубокое понимание ожидаемого времени выполнения заданий и поведения при масштабировании, характеристик ресурсов, распределения входных данных и других факторов. Не имея возможности точно оценить производительность, пользователи часто выделяют избыточные ресурсы для своих заданий, что приводит к низкому использованию ресурсов и высоким затратам. В этой статье мы представляем основные строительные блоки для совместного подхода к оптимизации конфигураций кластера обработки данных на основе данных времени выполнения и моделей производительности. Мы считаем, что данные среды выполнения можно совместно использовать и использовать для моделей производительности в различных контекстах выполнения, что значительно снижает зависимость от повторения отдельных заданий обработки или, в противном случае, специального профилирования заданий. Для этого мы опишем, как сходство заданий обработки и кластерных инфраструктур можно использовать для объединения подходящих точек данных из локальных и глобальных заданий в точные модели производительности. Кроме того, мы описываем подходы к прогнозированию производительности с помощью более контекстно-зависимых и многоразовых моделей. Наконец, мы показываем, как метрики из предыдущих выполнений могут быть объединены с мониторингом во время выполнения для эффективной динамической перенастройки моделей и кластеров.