Я тренирую CNN с изображениями 1M с theano. Теперь я озадачен тем, как подготовить данные для обучения.
Мои вопросы:
Когда изображения изменяются до 64*64*3, размер всех данных составляет около 100 ГБ. Должен ли я сохранять данные в один файл npy или в несколько файлов меньшего размера? какой из них эффективен?
Как определить количество параметров CNN? Как насчет 1М/10 = 100К?
Должен ли я ограничивать стоимость памяти тренировочного блока и параметры CNN меньше, чем память GPU?
Мой компьютер с памятью 16G и графическим процессором Titian.
Большое спасибо.