Допустим, у меня есть разделенная таблица улья
>show partitions db.my_table;
+----------------------------------+
| partition |
+----------------------------------+
| in_date=20-09-2020 |
| in_date=21-09-2020 |
| in_date=22-09-2020 |
+----------------------------------+
Если я вручную удалю каталоги разделов из HDFS с помощью
$hadoop fs -rm -r 'path/to/table/in_date=20-09-2020';
но не удаляйте разделы из таблицы улья
Вызовет ли это какую-либо реальную проблему (кроме наличия потерянных имен разделов в метаданных таблицы)?
ЧТО Я ПРОВЕРИЛ
Запросы таблицы куста работают нормально (как для внешних, так и для внутренних таблиц)
>select * from db.my_table; --works fine
>show partitions db.my_table --shows orphaned partitions,not a real problem
EDIT: запросы функций Aggergate, такие как COUNT (), MAX () и т. Д., Завершаются ошибкой
Путь ввода не существует: path / to / table / in_date = 20-09-2020
Кто-нибудь знает, может ли это вызвать другие проблемы / сломать какое-то другое приложение?