Если вы изучаете науку о данных/машинное обучение и в настоящее время работаете над презентацией промежуточного/финального проекта, здесь я перечисляю некоторые важные рекомендации, которые вы можете использовать в качестве контрольного списка.

👉 Характеристики хорошей презентации:

  • отличная презентация = содержание + дизайн + подача.
  • Обобщенная информация: Не нужно указывать каждую деталь, над которой вы работали (Не нужно показывать, что вы усердно работаете!).
  • просто и понятно: не слишком много текста, никаких сложных причудливых диаграмм.
  • показывать только те графики, которые имеют смысл: если паттерн непонятен на конкретном графике или вы не уверены в его интерпретации, пожалуйста, не добавляйте его!
  • Каждая диаграмма/график имеет легенду, заголовок и отличительные цвета, которые облегчают интерпретацию.
  • Презентация призвана помочь вам рассказать свою историю данных, а не ограничить вас.
  • Изложение, создающее противоречие (выдвигает гипотезы и опровергает их доказательствами).

👉 Предлагаемая структура (контрольный список)

  1. сформулируйте вопрос/деловую проблему просто и ясно в одном предложении.
  2. сформулируйте образ пользователя и решение мечты для нее/него: кто выиграет от ваших идей (менеджер по маркетингу? врач? инвестор? обычный пользователь (слушатель музыки?), чего он/она ожидает?
  3. Тип и цель исследования (описательное, прогностическое, BI Dashboard, проверка гипотез).
  4. Обзор набора данных: опишите данные, которые у вас есть:
  • Происхождение набора данных/тип сбора (веб-скрапинг/API и т. д.).
  • Высокоуровневая описательная сводка набора данных (количество строк, столбцов, качество данных, формат данных (несколько текстовых файлов, файлов JSON, файлов изображений и т. д.), процент отсутствующих значений и т. д.
  • До трех графиков, чтобы выделить основную сводку данных и дать представление о распределении данных.

5. Идеи/выводы: (ваши результаты)

  • Опишите функции, используемые для моделирования (выделите метод выбора функций, если он существует)
  • Методы/алгоритмы, используемые для моделирования, укажите, сколько итераций вы прошли
  • поделиться до трех интересных идей / выводов / шаблонов и интерпретировать результаты
  • выделите один пример наиболее важной функции и ее корреляции с целевой переменной или группой (в случае неконтролируемого обучения)
  • Точность модели на тестовых данных (и, если возможно, новые невидимые данные, живая демонстрация?)

6. Конвейер обработки данных (что вы сделали, чтобы получить указанные выше результаты)

  • Выделяет 2 интересных примера/шаблона вашего процесса очистки данных, желательно с графиками (отсутствующие значения, выбросы, форматирование данных).
  • Выделяет 2 интересных примера/шаблона вашего процесса преобразования данных.

7. Ограничения/перспективы

  • Текущие ограничения/блокирующие моменты, с которыми вы сталкиваетесь в рамках проекта.
  • Чем заняться в будущем, когда у вас появится дополнительное время.

8. покажите свои контактные данные (электронная почта или QR-код для Linkedin) на случай, если аудитория захочет связаться с вами для возможности найма, демонстрации и т. д.)

Об авторе:

Раафат — преподаватель науки о данных/аналитики из Берлина. Он имеет более чем 12-летний опыт работы в сфере данных и работал над несколькими проектами для крупных корпораций и стартапов.