Arhn - архитектура программирования

Какой Twitter API мне следует использовать для извлечения большого количества твитов для исследования НЛП?

Я хотел бы извлечь как можно больше твитов, содержащих заданное ключевое слово (обычно название компании).

Я использовал API поиска Twitter, но он ограничен «последними твитами». Так что по относительно редкому ключевому слову я могу получить не более 500 твитов.

Твиттер говорит, что вы не должны использовать API поиска для исследований. Итак, какой API мне следует использовать?

27.03.2012

Ответы:


1

Twitter не предоставляет бесплатный доступ к историческим данным. Datasift и Gnip оба продают доступ к пожарным шлангам Твиттера.

27.03.2012

2

Чтобы получить много твитов с определенными ключевыми словами, используйте API потоковой передачи с Статусы/Фильтр.

Сначала создайте файл (например, "tracking.txt") с условиями для отслеживания с ключевыми словами, разделенными запятыми. Это может включать хэш-теги. Например, я использовал следующее для получения твитов со ссылкой и определенными хэштегами.

track=http #baby,http #family,http #children, ...

Затем используйте curl, чтобы перенаправить поток в файл. Обязательно используйте свой твиттер-идентификатор и пароль.

curl -d @tracking.txt https://stream.twitter.com/1/statuses/filter.json -uAnyTwitterUser:Password > stream.json
27.03.2012
  • Спасибо за ваш ответ, но я боюсь, что этот API просто подтолкнет меня к новым твитам, а не к прошлым твитам, я прав? Поскольку мое ключевое слово редкое, мне также нужно обходить твиты. 27.03.2012
  • @ Блэксад, ты прав. Тем не менее, возможно, стоит попробовать, поскольку, имея достаточно большой пожарный шланг, вы можете найти достаточно данных. 27.03.2012
  • Я пытался, и я получаю 1 или 2 твита в час по заданному ключевому слову, которое мне нужно. Я не достаточно терпелив :) 27.03.2012
  • Новые материалы

    Коллекции публикаций по глубокому обучению
    Последние пару месяцев я создавал коллекции последних академических публикаций по различным подполям глубокого обучения в моем блоге https://amundtveit.com - эта публикация дает обзор 25..

    Представляем: Pepita
    Фреймворк JavaScript с открытым исходным кодом Я знаю, что недостатка в фреймворках JavaScript нет. Но я просто не мог остановиться. Я хотел написать что-то сам, со своими собственными..

    Советы по коду Laravel #2
    1-) Найти // You can specify the columns you need // in when you use the find method on a model User::find(‘id’, [‘email’,’name’]); // You can increment or decrement // a field in..

    Работа с временными рядами спутниковых изображений, часть 3 (аналитика данных)
    Анализ временных рядов спутниковых изображений для данных наблюдений за большой Землей (arXiv) Автор: Рольф Симоэс , Жильберто Камара , Жильберто Кейрос , Фелипе Соуза , Педро Р. Андраде ,..

    3 способа решить квадратное уравнение (3-й мой любимый) -
    1. Методом факторизации — 2. Используя квадратичную формулу — 3. Заполнив квадрат — Давайте поймем это, решив это простое уравнение: Мы пытаемся сделать LHS,..

    Создание VR-миров с A-Frame
    Виртуальная реальность (и дополненная реальность) стали главными модными терминами в образовательных технологиях. С недорогими VR-гарнитурами, такими как Google Cardboard , и использованием..

    Демистификация рекурсии
    КОДЕКС Демистификация рекурсии Упрощенная концепция ошеломляющей О чем весь этот шум? Рекурсия, кажется, единственная тема, от которой у каждого начинающего студента-информатика..