Я хочу создать аналитическую систему поверх платформы для публикации статей. В частности, я хочу отслеживать поведение пользователей при чтении (например, количество просмотров статьи, время, проведенное с открытой статьей, рейтинг и т. д.), а также статистику по самим статьям (например, количество абзацев, автор и т. д.). ).
Это будет иметь две цели:
- Представление информации о пользователях и статьях
- Давать рекомендации пользователям
Что касается части анализа данных, я рассматривал кубы, панды и pytables. Данных много, и они хранятся в таблицах MySQL; Я не уверен, какой из этих пакетов лучше справится с таким бэкендом.
Что касается части рекомендаций, я просто думаю о передаче данных из механизма анализа данных в модель кластеризации.
Любые рекомендации о том, как собрать все это вместе, а также классные проекты Python, которые могут мне помочь? Пожалуйста, дайте мне знать, если я должен дать больше информации.
Спасибо