Arhn - архитектура программирования

Невозможно получить табличный контент с веб-страницы с помощью запросов

Я пытаюсь очистить табличное содержимое от этого веб-страница. Чтобы найти контент, необходимо щелкнуть вкладку 12 под этим заголовком How to navigate the interactive report. При нажатии на эту вкладку табличное содержимое отображается внизу этой страницы под Moves To Austin-Round Rock-Georgetown, TX MSA.

Когда я наблюдаю сетевую активность в инструментах chrome dev при заполнении данных вручную, я мог заметить, что на этот URL-адрес отправляется HTTP-запрос публикации вместе с соответствующим параметром https://public.tableau.com/vizql/w/CBREMigrationAnalysisv1extract/v/CBREMigrationAnalysis/sessions/F3E2227B603E4F5AB3156667A673CF9E-0:0/commands/tabdoc/set-active-story-point , в котором часть между /sessions/ и /commands/ является динамической < / strong>.

Однако мне удалось получить эту динамическую часть из этот URL на лету перед отправкой запросов на публикацию. Теперь, когда я пытаюсь выполнить следующий сценарий, я получаю 500 код состояния.

Я пробовал:

import requests
from bs4 import BeautifulSoup
from pprint import pprint

base = 'https://public.tableau.com/views/CBREMigrationAnalysisv1extract/CBREMigrationAnalysis?:showVizHome=no&:embed=true&parentUrl=https%3A%2F%2Fwww.cbre.us%2Fresearch-and-reports%2FCOVID-19-Impact-on-Resident-Migration-Patterns'
link = 'https://public.tableau.com/vizql/w/CBREMigrationAnalysisv1extract/v/CBREMigrationAnalysis/sessions/{}/commands/tabdoc/set-active-story-point'

payload = {
    'storyboard': 'CBRE Migration Analysis',
    'storyPointId': '14',
    'shouldAutoCapture': 'false',
    'shouldAutoRevert': 'true'
}

headers = {
    'user-agent': 'Mozilla/5.0 (Windows NT 6.1) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/88.0.4324.150 Safari/537.36',
    'x-requested-with': 'XMLHttpRequest',
    'x-newrelic-id': 'XA4CV19WGwIBV1RVBQQBUA==',
    'x-tsi-active-tab': 'CBRE%20Migration%20Analysis',
    'x-tsi-supports-accepted': 'true',
    'referer': base,
}
with requests.Session() as s:
    s.headers['User-Agent'] = 'Mozilla/5.0 (Windows NT 6.1) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/88.0.4324.150 Safari/537.36'
    r = s.get(base)
    post_link = link.format(r.headers['X-Session-Id'])
    s.headers.update(headers)
    res = s.post(post_link,data=payload)
    print(res.status_code)
    pprint(res.json()['vqlCmdResponse']['layoutStatus']['applicationPresModel'])

Как я могу получить доступ к табличному содержимому с этой страницы с помощью запросов?


Ответы:


1

Я только что реализовал функцию Storypoints в этой библиотеке Tableau Scraper. Оформить заказ в разделе рассказов

Следующий код покажет все сюжетные точки и перейдет к сюжетной точке с идентификатором 14 (эквивалентно сюжетной точке с заголовком 12 в пользовательском интерфейсе). Затем он получает рабочий лист с именем P2P Table в фреймворк pandas:

from tableauscraper import TableauScraper as TS

url = 'https://public.tableau.com/views/CBREMigrationAnalysisv1extract/CBREMigrationAnalysis'
ts = TS()
ts.loads(url)
wb = ts.getWorkbook()

print(wb.getStoryPoints())
print("go to specific storypoint")
sp = wb.goToStoryPoint(storyPointId=14)

print(sp.getWorksheetNames())
print(sp.getWorksheet("P2P Table").data)

Попробуйте это на repl.it

19.06.2021
Новые материалы

Коллекции публикаций по глубокому обучению
Последние пару месяцев я создавал коллекции последних академических публикаций по различным подполям глубокого обучения в моем блоге https://amundtveit.com - эта публикация дает обзор 25..

Представляем: Pepita
Фреймворк JavaScript с открытым исходным кодом Я знаю, что недостатка в фреймворках JavaScript нет. Но я просто не мог остановиться. Я хотел написать что-то сам, со своими собственными..

Советы по коду Laravel #2
1-) Найти // You can specify the columns you need // in when you use the find method on a model User::find(‘id’, [‘email’,’name’]); // You can increment or decrement // a field in..

Работа с временными рядами спутниковых изображений, часть 3 (аналитика данных)
Анализ временных рядов спутниковых изображений для данных наблюдений за большой Землей (arXiv) Автор: Рольф Симоэс , Жильберто Камара , Жильберто Кейрос , Фелипе Соуза , Педро Р. Андраде ,..

3 способа решить квадратное уравнение (3-й мой любимый) -
1. Методом факторизации — 2. Используя квадратичную формулу — 3. Заполнив квадрат — Давайте поймем это, решив это простое уравнение: Мы пытаемся сделать LHS,..

Создание VR-миров с A-Frame
Виртуальная реальность (и дополненная реальность) стали главными модными терминами в образовательных технологиях. С недорогими VR-гарнитурами, такими как Google Cardboard , и использованием..

Демистификация рекурсии
КОДЕКС Демистификация рекурсии Упрощенная концепция ошеломляющей О чем весь этот шум? Рекурсия, кажется, единственная тема, от которой у каждого начинающего студента-информатика..


© 2024 arhn.ru, Arhn - архитектура программирования