Python | Число в слова с использованием num2words

Опубликовано: 15 Февраля, 2022

num2words module in Python, which converts number (like 34) to words (like thirty-four). Also, this library has support for multiple languages. In this article, we will see how to convert number to words using num2words module.

Installation
One can easily install num2words using pip.

pip install num2words

Рассмотрим следующие два отрывка из разных файлов, взятых из 20 групп новостей, популярной базы данных НЛП. Фактическая предварительная обработка 20 групп новостей остается предметом интереса.

In article, Martin Preston writes: Why not use the PD C library for reading/writing TIFF files? It took me a good 20 minutes to start using them in your own app.
ISCIS VIII is the eighth of a series of meetings which have brought together computer scientists and engineers from about twenty countries. This year’s conference will be held in the beautiful Mediterranean resort city of Antalya, in a region rich in natural as well as historical sites.

In the above two excerpts, one can observe that the number ’20’ appears in both numeric and alphabetical forms. Simply following the pre-processing steps, that involve tokenization, lemmatization and so on would not be able to map ’20’ and ‘twenty’ to the same stem, which is of contextual importance. Luckily, we have the in-built library, num2words which solves this problem in a single line.

Below is the sample usage of the tool.

from num2words import num2words
  
# Most common usage.
print(num2words(36))
  
# Other variants, according to the type of article.
print(num2words(36, to = "ordinal"))
print(num2words(36, to = "ordinal_num"))
print(num2words(36, to = "year"))
print(num2words(36, to = "currency"))
  
# Language Support.
print(num2words(36, lang ="es"))

Выход:

тридцать шесть
тридцать шестой
36-я
ноль евро, тридцать шесть центов
Treinta y Seis

Следовательно, на этапе предварительной обработки можно преобразовать ВСЕ числовые значения в слова для большей точности на дальнейших этапах.

Ссылки: https://pypi.org/project/num2words/

Внимание компьютерщик! Укрепите свои основы с помощью базового курса программирования Python и изучите основы.

Для начала подготовьтесь к собеседованию. Расширьте свои концепции структур данных с помощью курса Python DS. А чтобы начать свое путешествие по машинному обучению, присоединяйтесь к курсу Машинное обучение - базовый уровень.