Руководство разработчика

Базовые понятия

Пространства

Пространства в Tarantool — это коллекции кортежей. Как правило, кортежи в пространстве представляют собой объекты одного типа, хотя это и не обязательно.

Note

Аналог пространства — это таблица в традиционных (SQL) базах данных.

Пространства имеют целочисленные идентификаторы, которые задаются в конфигурации сервера. Чтобы обращаться к пространству, как к именованному объекту, можно использовать метод Connection.space() и экземпляр класса Space.

Пример:

>>> customer = connection.space(0)
>>> customer.insert(('FFFF', 'Foxtrot'))

Типы полей

Tarantool поддерживает три типа полей: STR, NUM и NUM64. Эти типы используются только при конфигурации индексов, но не сохраняются с данными кортежа и не передаются между сервером и клиентом. Таким образом, с точки зрения клиента, поля кортежей являются просто байтовыми массивами без явно заданных типов.

Для разработчика на Python намного удобнее использовать родные типы: int, long, unicode (для Python 3.x - int и str). Для бинарных данных следует использовать тип bytes (в этом случае приведение типов не производится).

Типы данных Tarantool соответствуют следующим типам Python:
  • RAW - bytes
  • STR - unicode (str for Python 3.x)
  • NUM - int
  • NUM64 - int or long (int for Python 3.x)
Для автоматического приведения типов необходимо объявить схему:
>>> import tarantool
>>> schema = {
        0: { # Space description
            'name': 'users', # Space name
            'default_type': tarantool.STR, # Type that used to decode fields that are not listed below
            'fields': {
                0: ('user_id', tarantool.NUM), # (field name, field type)
                1: ('num64field', tarantool.NUM64),
                2: ('strfield', tarantool.STR),
                #2: { 'name': 'strfield', 'type': tarantool.STR }, # Alternative syntax
                #2: tarantool.STR # Alternative syntax
            },
            'indexes': {
                0: ('pk', [0]), # (name, [field_no])
                #0: { 'name': 'pk', 'fields': [0]}, # Alternative syntax
                #0: [0], # Alternative syntax
            }
        }
    }
>>> connection = tarantool.connect(host = 'localhost', port=33013, schema = schema)
>>> demo = connection.space('users')
>>> demo.insert((0, 12, u'this is unicode string'))
>>> demo.select(0)
[(0, 12, u'this is unicode string')]

Как видно из примера, все значения были преобразованы в Python-типы в соответствии со схемой.

Кортеж Tarantool может содержать произвольное количество полей. Если какие-то поля не объявлены в схеме, то default_type будет использован для конвертации.

Поля с “сырыми” байтами следует использовать, если приложение работает с двоичными данными (например, изображения или python-объекты, сохраненные с помощью picke).

Возможно также указать тип для CALL запросов:

>>> ...
# Copy schema decription from 'users' space
>>> connection.call("box.select", '0', '0', 0L, space_name='users');
[(0, 12, u'this is unicode string')]
# Provide schema description explicitly
>>> field_defs = [('numfield', tarantool.NUM), ('num64field', tarantool.NUM)]
>>> connection.call("box.select", '0', '1', 184L, field_defs = field_defs, default_type = tarantool.STR);
[(0, 12, u'this is unicode string')]

Note

Python 2.6 добавляет синоним bytes к типу str (также поддерживается синтаксис b'').

Note

Для преобразования между bytes и unicode всегда используется utf-8

Результат запроса

Запросы (insert(), delete(), update(), select()) возвращают экземпляр класса Response.

Класс Response унаследован от стандартного типа list, поэтому, по сути, результат всегда представляет собой список кортежей.

Кроме того, у экземпляра Response есть атрибут rowcount. Этот атрибут содержит число записей, которые затронул запроc. Например, для запроса delete() rowcount равен 1, если запись была удалена.

Подключение к серверу

Для подключения к серверу следует использовать метод tarantool.connect(). Он возвращает экземпляр класса Connection.

Пример:

>>> import tarantool
>>> connection = tarantool.connect("localhost", 33013)
>>> type(connection)
<class 'tarantool.connection.Connection'>

Работа с данными

Tarantool поддерживает четыре базовых операции: insert, delete, update и select.

Note

НЕОБХОДИМО ОБЪЯСНИТЬ КАКИЕ ДАННЫЕ ИСПОЛЬЗУЮТСЯ ДЛЯ ПРИМЕРА

Добавление и замещение записей

Для добавления и замещения записей следует использовать метод Space.insert():

>>> user.insert((user_id, email, int(time.time())))

Первый элемент кортежа всегда является его уникальным первичным ключом.

Если запись с таким ключом уже существует, она будет замещена без какого либо предупреждения или сообщения об ошибке.

Note

Для Space.insert() Response.rowcount всегда равен 1.

Удаление записей

Для удаления записей следует использовать метод Space.delete():

>>> user.delete(primary_key)

Note

Response.rowcount равен 1, если запись была удалена. Если запись не найдена, то Response.rowcount равен 0.

Обновление записей

Запрос update в Tarantool позволяет одновременно и атомарно обновить несколько полей одного кортежа.

Для обновления записей следует использовать метод Space.update().

Пример:

>>> user.update(1001, [(1, '=', 'John'), (2, '=', 'Smith')])

В этом примере для полей 1 и 2 устанавливаются новые значения.

Метод Space.update() позволяет обновлять сразу несколько полей кортежа.

Tarantool поддерживает следующие операции обновления:
  • '=' – установить новое значение поля
  • '+' – прибавить аргумент к значению поля (оба аргумента рассматриваются как знаковые 32-битные целые числа)
  • '^' – битовый AND (только для 32-битных полей)
  • '|' – битовый XOR (только для 32-битных полей)
  • '&' – битовый OR (только для 32-битных полей)
  • 'splice' – аналог функции splice в Perl

Note

Нулевое (т.е. [0]) поле кортежа нельзя обновить, поскольку оно является первичным ключом

See also

Подробности в документации по методу Space.update()

Warning

Операция 'splice' пока не реализована

Выборка записей

Для выборки записей следует использовать метод Space.select(). Запрос SELECT может возвращать одну или множество записей.

Запрос по первичному ключу

Извлечь запись по её первичному ключу 3800:

>>> world.select(3800)
[(3800, u'USA', u'Texas', u'Dallas', 1188580)]

Запрос по вторичному индексу

>>> world.select('USA', index=1)
[(3796, u'USA', u'Texas', u'Houston', 1953631),
 (3801, u'USA', u'Texas', u'Huston', 10000),
 (3802, u'USA', u'California', u'Los Angeles', 10000),
 (3805, u'USA', u'California', u'San Francisco', 776733),
 (3800, u'USA', u'Texas', u'Dallas', 1188580),
 (3794, u'USA', u'California', u'Los Angeles', 3694820)]

Аргумент index=1 указывает, что при запросе следует использовать индекс 1. По умолчанию используется первыичный ключ (index=0).

Note

Вторичные индексы должны быть явно объявлены в конфигурации севера

Запрос записей по нескольким ключам

Note

Это аналог where key in (k1, k2, k3...)

Извлечь записи со значениями первичного ключа 3800, 3805 and 3796:

>>>> world.select([3800, 3805, 3796])
[(3800, u'USA', u'Texas', u'Dallas', 1188580),
 (3805, u'USA', u'California', u'San Francisco', 776733),
 (3796, u'USA', u'Texas', u'Houston', 1953631)]

Запрос по составному индексу

Извлечь данные о городах в Техасе:

>>> world.select([('USA', 'Texas')], index=1)
[(3800, u'USA', u'Texas', u'Dallas', 1188580), (3796, u'USA', u'Texas', u'Houston', 1953631)]

Запрос с явным указанием типов полей

Tarantool не имеет строгой схемы и поля кортежей являются просто байтовыми массивами. Можно указать типа полей непосредственно в параметре schema для `Connection

Вызов хранимых функций

Хранимые процедуры на Lua могут делать выборки и изменять данные, имеют доcтуп к конфигурации и могут выполнять административные функции.

Для вызова хранимых функций следует использовать метод Connection.call(). Кроме того, у этого метода есть псевдоним: Space.call().

Пример:

>>> server.call("box.select_range", (1, 3, 2, 'AAAA'))
[(3800, u'USA', u'Texas', u'Dallas', 1188580), (3794, u'USA', u'California', u'Los Angeles', 3694820)]

See also

Tarantool/Box User Guide » Writing stored procedures in Lua