rupo.accents package

Submodules

rupo.accents.classifier module

class rupo.accents.classifier.MLAccentClassifier(accents_dict: rupo.accents.dict.AccentDict) → None[исходный код]
Базовые классы: object

Классификатор ударений на основе машинного обучения.

classify_accent(word: str) → int[исходный код]

Проставление ударения в слове на основе классификатора.

Параметры:word – слово, в котором надо поставить ударение.
Результат:позиция буквы, на которую падает ударение.
clf_filename = 'clf_{}.pickle'
do_cross_val(accents_dict: rupo.accents.dict.AccentDict) → typing.List[float][исходный код]

Кроссвалидация классификаторов.

Параметры:accents_dict – словарь ударений.
Return result:среднее по кроссвалидации каждого классификатора.

rupo.accents.dict module

class rupo.accents.dict.AccentDict → None[исходный код]
Базовые классы: object

Класс данных, для сериализации словаря как dict’а и быстрой загрузки в память.

class AccentType[исходный код]
Базовые классы: enum.Enum

An enumeration.

ANY = -1
PRIMARY = 0
SECONDARY = 1
AccentDict.create(src_filename: str, dst_filename: str) → None[исходный код]

Загрузка словаря из файла. Если уже есть его сериализация в .trie файле, берём из него.

Параметры:
  • src_filename – имя файла с оригинальным словарём.
  • dst_filename – имя файла, в который будет сохранён дамп.
AccentDict.get_accents(word: str, accent_type: rupo.accents.dict.AccentDict.AccentType = <AccentType.ANY: -1>) → typing.List[int][исходный код]

Обёртка над data.get().

Параметры:
  • word – слово, которое мы хотим посмотреть в словаре.
  • accent_type – тип ударения.
Return forms:

массив всех ударений.

AccentDict.get_all() → typing.List[typing.Tuple[str, typing.List[typing.Tuple[int, rupo.accents.dict.AccentDict.AccentType]]]][исходный код]
Return items:все ключи и ударения словаря.
AccentDict.save(dst_filename: str) → None[исходный код]

Сохранение дампа.

Параметры:dst_filename – имя файла, в который сохраняем дамп словаря.

rupo.accents.test_accent_classifier module

class rupo.accents.test_accent_classifier.TestAccentClassifier(methodName='runTest')[исходный код]
Базовые классы: unittest.case.TestCase
classmethod setUpClass()[исходный код]
test_accent_classifier()[исходный код]

rupo.accents.test_dict module

class rupo.accents.test_dict.TestAccentDict(methodName='runTest')[исходный код]
Базовые классы: unittest.case.TestCase
classmethod setUpClass()[исходный код]
test_accent_only_in_vowels()[исходный код]
test_get_accents()[исходный код]
test_load_and_create()[исходный код]

Module contents