Если вы изучаете науку о данных/машинное обучение и в настоящее время работаете над презентацией промежуточного/финального проекта, здесь я перечисляю некоторые важные рекомендации, которые вы можете использовать в качестве контрольного списка.
👉 Характеристики хорошей презентации:
- отличная презентация = содержание + дизайн + подача.
- Обобщенная информация: Не нужно указывать каждую деталь, над которой вы работали (Не нужно показывать, что вы усердно работаете!).
- просто и понятно: не слишком много текста, никаких сложных причудливых диаграмм.
- показывать только те графики, которые имеют смысл: если паттерн непонятен на конкретном графике или вы не уверены в его интерпретации, пожалуйста, не добавляйте его!
- Каждая диаграмма/график имеет легенду, заголовок и отличительные цвета, которые облегчают интерпретацию.
- Презентация призвана помочь вам рассказать свою историю данных, а не ограничить вас.
- Изложение, создающее противоречие (выдвигает гипотезы и опровергает их доказательствами).
👉 Предлагаемая структура (контрольный список)
- сформулируйте вопрос/деловую проблему просто и ясно в одном предложении.
- сформулируйте образ пользователя и решение мечты для нее/него: кто выиграет от ваших идей (менеджер по маркетингу? врач? инвестор? обычный пользователь (слушатель музыки?), чего он/она ожидает?
- Тип и цель исследования (описательное, прогностическое, BI Dashboard, проверка гипотез).
- Обзор набора данных: опишите данные, которые у вас есть:
- Происхождение набора данных/тип сбора (веб-скрапинг/API и т. д.).
- Высокоуровневая описательная сводка набора данных (количество строк, столбцов, качество данных, формат данных (несколько текстовых файлов, файлов JSON, файлов изображений и т. д.), процент отсутствующих значений и т. д.
- До трех графиков, чтобы выделить основную сводку данных и дать представление о распределении данных.
5. Идеи/выводы: (ваши результаты)
- Опишите функции, используемые для моделирования (выделите метод выбора функций, если он существует)
- Методы/алгоритмы, используемые для моделирования, укажите, сколько итераций вы прошли
- поделиться до трех интересных идей / выводов / шаблонов и интерпретировать результаты
- выделите один пример наиболее важной функции и ее корреляции с целевой переменной или группой (в случае неконтролируемого обучения)
- Точность модели на тестовых данных (и, если возможно, новые невидимые данные, живая демонстрация?)
6. Конвейер обработки данных (что вы сделали, чтобы получить указанные выше результаты)
- Выделяет 2 интересных примера/шаблона вашего процесса очистки данных, желательно с графиками (отсутствующие значения, выбросы, форматирование данных).
- Выделяет 2 интересных примера/шаблона вашего процесса преобразования данных.
7. Ограничения/перспективы
- Текущие ограничения/блокирующие моменты, с которыми вы сталкиваетесь в рамках проекта.
- Чем заняться в будущем, когда у вас появится дополнительное время.
8. покажите свои контактные данные (электронная почта или QR-код для Linkedin) на случай, если аудитория захочет связаться с вами для возможности найма, демонстрации и т. д.)
Об авторе:
Раафат — преподаватель науки о данных/аналитики из Берлина. Он имеет более чем 12-летний опыт работы в сфере данных и работал над несколькими проектами для крупных корпораций и стартапов.