rupo.main package

Submodules

rupo.main.markup module

class rupo.main.markup.Annotation(begin: int, end: int, text: str) → None[исходный код]
Базовые классы: rupo.util.mixins.CommonMixin

Класс аннотации. Содержит начальную и конечную позицию в тексте, а также текст аннотации .

class rupo.main.markup.Line(begin: int, end: int, text: str, words: typing.List[rupo.main.markup.Word]) → None[исходный код]
Базовые классы: rupo.main.markup.Annotation

Разметка строки. Включает в себя аннотацию строки и её слова.

from_dict(d) → rupo.main.markup.Line[исходный код]
class rupo.main.markup.Markup(text: str = None, lines: typing.List[rupo.main.markup.Line] = None) → None[исходный код]
Базовые классы: rupo.util.mixins.CommonMixin

Класс данных для разметки в целом с экспортом/импортом в XML и JSON.

from_dict(d) → rupo.main.markup.Markup[исходный код]
from_json(st) → rupo.main.markup.Markup[исходный код]
from_xml(xml: str) → rupo.main.markup.Markup[исходный код]

Импорт из XML.

Параметры:xml – XML-разметка
Return self:получившийся объект Markup
to_json() → str[исходный код]
to_xml() → str[исходный код]

Экспорт в XML.

Return self:строка в формате XML
class rupo.main.markup.Syllable(begin: int, end: int, number: int, text: str, accent: int = -1) → None[исходный код]
Базовые классы: rupo.main.markup.Annotation

Разметка слога. Включает в себя аннотацию и номер слога, а также ударение. Если ударение падает не на этот слог, -1.

from_dict(d: dict) → rupo.main.markup.Syllable[исходный код]
vowel() → int[исходный код]
Результат:позиция гласной буквы этого слога в слове (с 0).
class rupo.main.markup.Word(begin: int, end: int, text: str, syllables: typing.List[rupo.main.markup.Syllable]) → None[исходный код]
Базовые классы: rupo.main.markup.Annotation

Разметка слова. Включает в себя аннотацию слова и его слоги.

accent() → int[исходный код]
Результат:последнее ударение в слове, если нет, то -1.
count_accents() → int[исходный код]
Результат:количество ударений в слове.
from_dict(d: dict) → rupo.main.markup.Word[исходный код]
get_accented_syllables_numbers() → typing.List[int][исходный код]
Результат:номера слогов, на которые падают ударения.
get_short() → str[исходный код]
Результат:слово в форме “текст”+”последнее ударение”.
set_accents(accents: typing.List[int]) → None[исходный код]

Задать ударения, все остальные убираются.

Параметры:accents – позиции ударения в слове.

rupo.main.phonetics module

class rupo.main.phonetics.Phonetics[исходный код]
Базовые классы: object

Класс-механизм для фонетического анализа слов.

static get_improved_word_accent(word: str, accent_dict: rupo.accents.dict.AccentDict, accent_classifier) → int[исходный код]

Получение ударения с учётом классификатора.

Параметры:
  • word – слово.
  • accent_dict – словарь ударений.
  • accent_classifier – классификатор ударений.
Результат:

индекс ударения.

static get_word_accents(word: str, accents_dict: rupo.accents.dict.AccentDict) → typing.List[int][исходный код]

Определение ударения в слове по словарю. Возможно несколько вариантов ударения.

Параметры:
  • word – слово для простановки ударений.
  • accents_dict – экземпляр обёртки для словаря ударений.
Return accents:

позиции букв, на которые падает ударение.

static get_word_syllables(word: str) → typing.List[rupo.main.markup.Syllable][исходный код]

Разделение слова на слоги.

Параметры:word – слово для разбивки на слоги.
Return syllables:
 массив слогов слова.
static process_text(text: str, accents_dict: rupo.accents.dict.AccentDict) → rupo.main.markup.Markup[исходный код]

Получение начального варианта разметки по слогам и ударениям.

Параметры:
  • text – текст для разметки
  • accents_dict – экземпляр обёртки для словаря ударений
Return markup:

разметка по слогам и ударениям

rupo.main.test_markup module

class rupo.main.test_markup.TestMarkup(methodName='runTest')[исходный код]
Базовые классы: unittest.case.TestCase
test_from_to()[исходный код]

rupo.main.test_phonetics module

class rupo.main.test_phonetics.TestPhonetics(methodName='runTest')[исходный код]
Базовые классы: unittest.case.TestCase
classmethod setUpClass()[исходный код]
test_accents()[исходный код]
test_process_text()[исходный код]
test_syllables()[исходный код]

Module contents