Что, если бы вы могли задавать вопросы по документам HTML, не преобразовывая их сначала в обычный текст? Именно в этом и заключается цель Microsoft MarkupLM: просто возьмите страницу и задайте вопрос.

Я создал Hugging Face Space, чтобы вы могли экспериментировать с любым активным URL-адресом. Я также реализовал многопоточность, чтобы ускорить работу процессора. Попробуйте и дайте мне знать, что вы думаете :)

✅ Пространство: https://huggingface.co/spaces/juliensimon/webpage_questions
✅ Модель: https://huggingface.co/microsoft/markuplm-base-finetuned-websrc
✅ Бумага : https://arxiv.org/abs/2110.08518