Используя асинхронный гем postgresql

Я использую Голиафа (который работает на eventmachine) и драгоценный камень postgres pg, в настоящее время я использую гем pg блокирующим способом: conn.exec('SELECT * FROM products') (например) и мне интересно, есть ли лучший способ подключения к базе данных postgres?

4 ответа

Решение

pg библиотека обеспечивает полную поддержку асинхронного API PostgreSQL. Я добавил пример того, как использовать его в samples/ каталог:

#!/usr/bin/env ruby

require 'pg'

# This is a example of how to use the asynchronous API to query the
# server without blocking other threads. It's intentionally low-level;
# if you hooked up the PGconn#socket to some kind of reactor, you
# could make this much nicer.

TIMEOUT = 5.0 # seconds to wait for an async operation to complete
CONN_OPTS = {
    :host     => 'localhost',
    :dbname   => 'test',
    :user     => 'jrandom',
    :password => 'banks!stealUR$',
}

# Print 'x' continuously to demonstrate that other threads aren't
# blocked while waiting for the connection, for the query to be sent,
# for results, etc. You might want to sleep inside the loop or 
# comment this out entirely for cleaner output.
progress_thread = Thread.new { loop { print 'x' } }

# Output progress messages
def output_progress( msg )
    puts "\n>>> #{msg}\n"
end

# Start the connection
output_progress "Starting connection..."
conn = PGconn.connect_start( CONN_OPTS ) or 
    abort "Unable to create a new connection!"
abort "Connection failed: %s" % [ conn.error_message ] if
    conn.status == PGconn::CONNECTION_BAD

# Now grab a reference to the underlying socket so we know when the
# connection is established
socket = IO.for_fd( conn.socket )

# Track the progress of the connection, waiting for the socket to 
# become readable/writable before polling it
poll_status = PGconn::PGRES_POLLING_WRITING
until poll_status == PGconn::PGRES_POLLING_OK ||
      poll_status == PGconn::PGRES_POLLING_FAILED

    # If the socket needs to read, wait 'til it becomes readable to
    # poll again
    case poll_status
    when PGconn::PGRES_POLLING_READING
        output_progress "  waiting for socket to become readable"
        select( [socket], nil, nil, TIMEOUT ) or
            raise "Asynchronous connection timed out!"

    # ...and the same for when the socket needs to write
    when PGconn::PGRES_POLLING_WRITING
        output_progress "  waiting for socket to become writable"
        select( nil, [socket], nil, TIMEOUT ) or
            raise "Asynchronous connection timed out!"
    end

    # Output a status message about the progress
    case conn.status
    when PGconn::CONNECTION_STARTED
        output_progress "  waiting for connection to be made."
    when PGconn::CONNECTION_MADE
        output_progress "  connection OK; waiting to send."
    when PGconn::CONNECTION_AWAITING_RESPONSE
        output_progress "  waiting for a response from the server."
    when PGconn::CONNECTION_AUTH_OK
        output_progress "  received authentication; waiting for " +
                        "backend start-up to finish."
    when PGconn::CONNECTION_SSL_STARTUP
        output_progress "  negotiating SSL encryption."
    when PGconn::CONNECTION_SETENV
        output_progress "  negotiating environment-driven " +
                        "parameter settings."
    end

    # Check to see if it's finished or failed yet
    poll_status = conn.connect_poll
end

abort "Connect failed: %s" % [ conn.error_message ] unless 
    conn.status == PGconn::CONNECTION_OK

output_progress "Sending query"
conn.send_query( "SELECT * FROM pg_stat_activity" )

# Fetch results until there aren't any more
loop do
    output_progress "  waiting for a response"

    # Buffer any incoming data on the socket until a full result 
    # is ready. 
    conn.consume_input
    while conn.is_busy
        select( [socket], nil, nil, TIMEOUT ) or
            raise "Timeout waiting for query response."
        conn.consume_input
    end

    # Fetch the next result. If there isn't one, the query is 
    # finished
    result = conn.get_result or break

    puts "\n\nQuery result:\n%p\n" % [ result.values ]
end

output_progress "Done."
conn.finish

if defined?( progress_thread )
    progress_thread.kill
    progress_thread.join
end

Я бы порекомендовал вам прочитать документацию по функции PQconnectStart и разделу " Асинхронная обработка команд" руководства PostgreSQL, а затем сравнить это с примером выше.

Я раньше не использовал EventMachine, но если он позволяет зарегистрировать сокет и обратные вызовы, когда он станет доступным для чтения / записи, я думаю, что было бы довольно легко интегрировать в него вызовы базы данных.

Я хотел использовать идеи из статьи Ильи Григорика об использовании Fibers для очистки четного кода, чтобы сделать использование асинхронного API более простым, но это далеко не так. У меня есть открытый билет, чтобы отследить его, если вы заинтересованы / мотивированы сделать это самостоятельно.

Да, вы можете получить доступ к postgres неблокирующим способом из Голиафа. У меня была такая же потребность, и я собрал это доказательство концепции: https://github.com/levicook/goliath-postgres-spike

Я (больше) не очень знаком с Pg, но я не слышал, чтобы какая-либо популярная база данных могла асинхронизировать соединения. Таким образом, вам все еще нужно поддерживать соединение с базой данных на время запроса. Поэтому вам все еще нужно заблокировать некоторые из них вниз по стеку.

В зависимости от вашего приложения, вы, возможно, уже делаете это наилучшим образом.

Но когда вы имеете дело с каким-то приложением для опроса (где один и тот же клиент отправляет множество запросов за короткое время), и более важно получить ответ, даже если он пуст, тогда вы можете написать ruby Fiber или отбросить перегруженный поток или процесс, который является долгоживущим и передает запросы к БД и кэширует результаты.

Например: запрос поступает от клиента A. Приложение Goliath обрабатывает запрос к процессу БД с некоторым уникальным идентификатором и отвечает на запрос "пока нет данных". Процесс БД завершает запрос и сохраняет результаты в кэш с идентификатором. Когда следующий запрос поступает от того же клиента, Голиаф видит, что у него уже есть ожидающие результаты запроса, удаляет результаты из кэша и отвечает клиенту. В то же время он планирует следующий запрос с процессом БД, чтобы он был готов раньше. Если следующий запрос поступит до того, как последний будет завершен, новый запрос не запланирован (без умножения запросов).

Таким образом, ваши ответы будут быстрыми и неблокирующими, но при этом будут обслуживаться свежие данные из БД ASAP. Конечно, они могут быть немного не синхронизированы с фактическими данными, но опять же, в зависимости от приложения, это может не быть проблемой.

Идея состоит в том, чтобы использовать асинхронный адаптер для базы данных (Postgresql) в сочетании с четным веб-сервером (Goliath) для повышения производительности. В прошлом году Майк Перхэм написал адаптер активной записи PG для Rails 2.3. Может быть, вы можете использовать это.

В качестве другого примера Илья Григорик выпустил эту демонстрацию асинхронного стека Rails. В этом случае сервер Evented имеет значение Thin, а база данных - Mysql. Установите демо-версию и попробуйте эталонный тест с драйвером, поддерживающим EM, и без него. Разница драматическая.

Другие вопросы по тегам