rupo.main package¶
Submodules¶
rupo.main.markup module¶
-
class
rupo.main.markup.Annotation(begin: int, end: int, text: str) → None[исходный код]¶ - Базовые классы:
rupo.util.mixins.CommonMixinКласс аннотации. Содержит начальную и конечную позицию в тексте, а также текст аннотации .
-
class
rupo.main.markup.Line(begin: int, end: int, text: str, words: typing.List[rupo.main.markup.Word]) → None[исходный код]¶ - Базовые классы:
rupo.main.markup.AnnotationРазметка строки. Включает в себя аннотацию строки и её слова.
-
from_dict(d) → rupo.main.markup.Line[исходный код]¶
-
-
class
rupo.main.markup.Markup(text: str = None, lines: typing.List[rupo.main.markup.Line] = None) → None[исходный код]¶ - Базовые классы:
rupo.util.mixins.CommonMixinКласс данных для разметки в целом с экспортом/импортом в XML и JSON.
-
from_dict(d) → rupo.main.markup.Markup[исходный код]¶
-
from_json(st) → rupo.main.markup.Markup[исходный код]¶
-
from_xml(xml: str) → rupo.main.markup.Markup[исходный код]¶ Импорт из XML.
Параметры: xml – XML-разметка Return self: получившийся объект Markup
-
to_json() → str[исходный код]¶
-
to_xml() → str[исходный код]¶ Экспорт в XML.
Return self: строка в формате XML
-
-
class
rupo.main.markup.Syllable(begin: int, end: int, number: int, text: str, accent: int = -1) → None[исходный код]¶ - Базовые классы:
rupo.main.markup.AnnotationРазметка слога. Включает в себя аннотацию и номер слога, а также ударение. Если ударение падает не на этот слог, -1.
-
from_dict(d: dict) → rupo.main.markup.Syllable[исходный код]¶
-
vowel() → int[исходный код]¶ Результат: позиция гласной буквы этого слога в слове (с 0).
-
-
class
rupo.main.markup.Word(begin: int, end: int, text: str, syllables: typing.List[rupo.main.markup.Syllable]) → None[исходный код]¶ - Базовые классы:
rupo.main.markup.AnnotationРазметка слова. Включает в себя аннотацию слова и его слоги.
-
accent() → int[исходный код]¶ Результат: последнее ударение в слове, если нет, то -1.
-
count_accents() → int[исходный код]¶ Результат: количество ударений в слове.
-
from_dict(d: dict) → rupo.main.markup.Word[исходный код]¶
-
get_accented_syllables_numbers() → typing.List[int][исходный код]¶ Результат: номера слогов, на которые падают ударения.
-
get_short() → str[исходный код]¶ Результат: слово в форме “текст”+”последнее ударение”.
-
set_accents(accents: typing.List[int]) → None[исходный код]¶ Задать ударения, все остальные убираются.
Параметры: accents – позиции ударения в слове.
-
rupo.main.phonetics module¶
-
class
rupo.main.phonetics.Phonetics[исходный код]¶ - Базовые классы:
objectКласс-механизм для фонетического анализа слов.
-
static
get_improved_word_accent(word: str, accent_dict: rupo.accents.dict.AccentDict, accent_classifier) → int[исходный код]¶ Получение ударения с учётом классификатора.
Параметры: - word – слово.
- accent_dict – словарь ударений.
- accent_classifier – классификатор ударений.
Результат: индекс ударения.
-
static
get_word_accents(word: str, accents_dict: rupo.accents.dict.AccentDict) → typing.List[int][исходный код]¶ Определение ударения в слове по словарю. Возможно несколько вариантов ударения.
Параметры: - word – слово для простановки ударений.
- accents_dict – экземпляр обёртки для словаря ударений.
Return accents: позиции букв, на которые падает ударение.
-
static
get_word_syllables(word: str) → typing.List[rupo.main.markup.Syllable][исходный код]¶ Разделение слова на слоги.
Параметры: word – слово для разбивки на слоги. Return syllables: массив слогов слова.
-
static
process_text(text: str, accents_dict: rupo.accents.dict.AccentDict) → rupo.main.markup.Markup[исходный код]¶ Получение начального варианта разметки по слогам и ударениям.
Параметры: - text – текст для разметки
- accents_dict – экземпляр обёртки для словаря ударений
Return markup: разметка по слогам и ударениям
-
static
rupo.main.test_markup module¶
-
class
rupo.main.test_markup.TestMarkup(methodName='runTest')[исходный код]¶ - Базовые классы:
unittest.case.TestCase-
test_from_to()[исходный код]¶
-
rupo.main.test_phonetics module¶
-
class
rupo.main.test_phonetics.TestPhonetics(methodName='runTest')[исходный код]¶ - Базовые классы:
unittest.case.TestCase-
classmethod
setUpClass()[исходный код]¶
-
test_accents()[исходный код]¶
-
test_process_text()[исходный код]¶
-
test_syllables()[исходный код]¶
-
classmethod