Обнаружение временных аномалий в реальном мире с помощью контролируемого машинного обучения и теории множеств

Сиэтл Берк Гилман Трейл

Изучите открытые данные города Сиэтла

Оглавление:

I. Постановка задачи

II. Ремоделирование временных рядов в контролируемую задачу

III. Контролируемое моделирование и анализ

I. Постановка задачи

Данные можно скачать здесь: Сиэтл Берк Гилман Трейл | Каггл

Суть этой постановки задачи состоит в том, что нам необходимо обнаружить аномалии за 3 часа.Аномалия определяется как всего 500 человек на следе через 3 часа. Чтобы решить эту проблему, мы даны почасовые данные о дорожном движении — пешеходном и велосипедном.

II. Ремоделирование временных рядов в контролируемую задачу

Итак, что мы можем сделать, так это сделать две копии данных, а затем соединить их так, чтобы час 0 сопоставлялся с часом 3 в одной строке.

Как это делается?

Сначала вносим данные:

import pandas as pd
df = pd.read_csv(r’/content/burke-gilman-trail-north-of-ne-70th-st-bike-and-ped-counter.csv’)

# change df to dataframe

df = pd.DataFrame(df)
df = df.fillna(0)

После того, как мы это сделали, теперь давайте сделаем копию наших данных, которая начинается со строки 3:

#create df2 that starts at the 4th row

df2 = df[df.index >= 3]
df2.head()

Теперь мы добавим столбец индекса в оба фрейма данных, который начинается с 1:

# add a numbering column to both df1 and df2. the first row should 1, second row is 2 and so on.  Both dataframe columns should start at 1

df['index'] = list(range(1, len(df) + 1))
df2['index'] = list(range(1, len(df2) + 1))

Причина, по которой мы это делаем, заключается в том, что мы можем присоединиться к столбцу индекса. Индекс 1 присоединится к индексу 1 в df2, но в этой строке мы увидим час 0 слева и час 3 справа…

материалы по теме:

Новые материалы

Коллекции публикаций по глубокому обучению

Последние пару месяцев я создавал коллекции последних академических публикаций по различным подполям глубокого обучения в моем блоге https://amundtveit.com - эта публикация дает обзор 25..

Представляем: Pepita

Фреймворк JavaScript с открытым исходным кодом Я знаю, что недостатка в фреймворках JavaScript нет. Но я просто не мог остановиться. Я хотел написать что-то сам, со своими собственными..

Советы по коду Laravel #2

1-) Найти // You can specify the columns you need // in when you use the find method on a model User::find(‘id’, [‘email’,’name’]); // You can increment or decrement // a field in..

Работа с временными рядами спутниковых изображений, часть 3 (аналитика данных)

Анализ временных рядов спутниковых изображений для данных наблюдений за большой Землей (arXiv) Автор: Рольф Симоэс , Жильберто Камара , Жильберто Кейрос , Фелипе Соуза , Педро Р. Андраде ,..

3 способа решить квадратное уравнение (3-й мой любимый) -

1. Методом факторизации — 2. Используя квадратичную формулу — 3. Заполнив квадрат — Давайте поймем это, решив это простое уравнение: Мы пытаемся сделать LHS,..

Создание VR-миров с A-Frame

Виртуальная реальность (и дополненная реальность) стали главными модными терминами в образовательных технологиях. С недорогими VR-гарнитурами, такими как Google Cardboard , и использованием..

Демистификация рекурсии

КОДЕКС Демистификация рекурсии Упрощенная концепция ошеломляющей О чем весь этот шум? Рекурсия, кажется, единственная тема, от которой у каждого начинающего студента-информатика..

Метки

Machine Learning JavaScript Data Science Artificial Intelligence Web Development Software Development Python Coding Deep Learning AI React Software Engineering Nodejs Front End Development Java Algorithms Typescript Computer Science Data Tech Development CSS HTML Programming Languages Startup Productivity Python Programming Tutorial Angular Neural Networks Computer Vision Open Source Javascript Tips AWS Education NLP Learning Mlops