Блог

НЛП | Сингулярность существительных множественного числа и замена бесконечных фраз
Давайте разберемся с этим на примере:Достаточно ли дрессируется наш ребенок?Достаточно ли дрессируется наш ребенок? Глагол «есть» может использоватьс...подробнее
НЛП | Замена глагольных фраз и существительных кардиналов
Нужно поменять местами глагольные фразы? Чтобы исключить пассивный залог в определенных фразах. Эта нормализация полезна при частотном анализе, когд...подробнее
НЛП | Исправление глагольных форм
Давайте разберемся с этим на примере:Достаточно ли дрессируется наш ребенок?Достаточно ли дрессируется наш ребенок? Глагол «есть» может использоватьс...подробнее
НЛП | Чанкинг на основе классификатора | Комплект 2
Используя данные из корпуса treebank_chunk, давайте оценим чанки (подготовленные в предыдущей статье). Код №1: # loading librariesfrom chunkers impor...подробнее
НЛП | Чанкинг на основе классификатора | Комплект 1
Класс <strong>ClassifierBasedTagger class</strong> учится на функциях, в отличие от большинства тегеров части речи. <strong>ClassifierChunker class</s...подробнее
НЛП | Чанкер на основе обучающих тегов | Комплект 2
Корпус Conll2000 определяет чанки с помощью тегов IOB.</p>Он указывает, где начинается и заканчивается фрагмент, а также его типы.Тегер части речи мож...подробнее
НЛП | Чанкер на основе обучающих тегов | Комплект 1
Обучение фрагмента - это альтернатива ручному указанию шаблонов фрагментов регулярного выражения (regex). Но ручное обучение заданию выражения - это у...подробнее
НЛП | Отсрочка тегирования для объединения тегеров
Что такое теги части речи (POS)? Это процесс преобразования предложения в формы - список слов, список кортежей (где каждый кортеж имеет форму (слово...подробнее
НЛП | Объединение тегов NGram
NgramTagger имеет 3 подклассаUnigramTaggerBigramTaggerTrigramTagger Подкласс BigramTagger использует предыдущий тег как часть своего контекста. Под...подробнее
НЛП | Вероятные теги Word
nltk.probability.FreqDist используется для поиска наиболее распространенных слов путем подсчета частот слов в корпусе банка деревьев. Класс Conditiona...подробнее