rupo.accents package¶
Submodules¶
rupo.accents.classifier module¶
-
class
rupo.accents.classifier.
MLAccentClassifier
(accents_dict: rupo.accents.dict.AccentDict) → None[исходный код]¶ - Базовые классы:
object
Классификатор ударений на основе машинного обучения.
-
classify_accent
(word: str) → int[исходный код]¶ Проставление ударения в слове на основе классификатора.
Параметры: word – слово, в котором надо поставить ударение. Результат: позиция буквы, на которую падает ударение.
-
clf_filename
= 'clf_{}.pickle'¶
-
do_cross_val
(accents_dict: rupo.accents.dict.AccentDict) → typing.List[float][исходный код]¶ Кроссвалидация классификаторов.
Параметры: accents_dict – словарь ударений. Return result: среднее по кроссвалидации каждого классификатора.
-
rupo.accents.dict module¶
-
class
rupo.accents.dict.
AccentDict
→ None[исходный код]¶ - Базовые классы:
object
Класс данных, для сериализации словаря как dict’а и быстрой загрузки в память.
-
class
AccentType
[исходный код]¶ - Базовые классы:
enum.Enum
An enumeration.
-
ANY
= -1¶
-
PRIMARY
= 0¶
-
SECONDARY
= 1¶
-
-
AccentDict.
create
(src_filename: str, dst_filename: str) → None[исходный код]¶ Загрузка словаря из файла. Если уже есть его сериализация в .trie файле, берём из него.
Параметры: - src_filename – имя файла с оригинальным словарём.
- dst_filename – имя файла, в который будет сохранён дамп.
-
AccentDict.
get_accents
(word: str, accent_type: rupo.accents.dict.AccentDict.AccentType = <AccentType.ANY: -1>) → typing.List[int][исходный код]¶ Обёртка над data.get().
Параметры: - word – слово, которое мы хотим посмотреть в словаре.
- accent_type – тип ударения.
Return forms: массив всех ударений.
-
AccentDict.
get_all
() → typing.List[typing.Tuple[str, typing.List[typing.Tuple[int, rupo.accents.dict.AccentDict.AccentType]]]][исходный код]¶ Return items: все ключи и ударения словаря.
-
AccentDict.
save
(dst_filename: str) → None[исходный код]¶ Сохранение дампа.
Параметры: dst_filename – имя файла, в который сохраняем дамп словаря.
-
class
rupo.accents.test_accent_classifier module¶
-
class
rupo.accents.test_accent_classifier.
TestAccentClassifier
(methodName='runTest')[исходный код]¶ - Базовые классы:
unittest.case.TestCase
-
classmethod
setUpClass
()[исходный код]¶
-
test_accent_classifier
()[исходный код]¶
-
classmethod
rupo.accents.test_dict module¶
-
class
rupo.accents.test_dict.
TestAccentDict
(methodName='runTest')[исходный код]¶ - Базовые классы:
unittest.case.TestCase
-
classmethod
setUpClass
()[исходный код]¶
-
test_accent_only_in_vowels
()[исходный код]¶
-
test_get_accents
()[исходный код]¶
-
test_load_and_create
()[исходный код]¶
-
classmethod