Arhn - архитектура программирования

Выбор функций для классификации текста

Я работаю над проблемой классификации текста, в которой в качестве функций выбираются 100 наиболее часто встречающихся слов. Я считаю, что результаты можно было бы улучшить, если бы я использовал лучший метод выбора функций? Любые идеи? Может ли TF-IDF работать? Если да, то как?


  • Этот вопрос кажется не по теме, потому что он касается классификации текста и, вероятно, лучше подходит для scicomp.stackexchange.com 07.10.2013
  • Возможный дубликат: stackoverflow.com/questions/13603882/ 09.06.2020

Ответы:


1

для улучшения результатов вы можете использовать Выбор функций

1) Получение информации

2) Хи-квадрат

3) Взаимная информация

4) Частота сроков

TF-IDF, вы можете увидеть эту ссылку, это поможет вам

24.12.2013
Новые материалы

Коллекции публикаций по глубокому обучению
Последние пару месяцев я создавал коллекции последних академических публикаций по различным подполям глубокого обучения в моем блоге https://amundtveit.com - эта публикация дает обзор 25..

Представляем: Pepita
Фреймворк JavaScript с открытым исходным кодом Я знаю, что недостатка в фреймворках JavaScript нет. Но я просто не мог остановиться. Я хотел написать что-то сам, со своими собственными..

Советы по коду Laravel #2
1-) Найти // You can specify the columns you need // in when you use the find method on a model User::find(‘id’, [‘email’,’name’]); // You can increment or decrement // a field in..

Работа с временными рядами спутниковых изображений, часть 3 (аналитика данных)
Анализ временных рядов спутниковых изображений для данных наблюдений за большой Землей (arXiv) Автор: Рольф Симоэс , Жильберто Камара , Жильберто Кейрос , Фелипе Соуза , Педро Р. Андраде ,..

3 способа решить квадратное уравнение (3-й мой любимый) -
1. Методом факторизации — 2. Используя квадратичную формулу — 3. Заполнив квадрат — Давайте поймем это, решив это простое уравнение: Мы пытаемся сделать LHS,..

Создание VR-миров с A-Frame
Виртуальная реальность (и дополненная реальность) стали главными модными терминами в образовательных технологиях. С недорогими VR-гарнитурами, такими как Google Cardboard , и использованием..

Демистификация рекурсии
КОДЕКС Демистификация рекурсии Упрощенная концепция ошеломляющей О чем весь этот шум? Рекурсия, кажется, единственная тема, от которой у каждого начинающего студента-информатика..