Лучшие практики для распараллеливания с использованием асинхронного рабочего процесса

Допустим, я хотел почистить веб-страницу и извлечь некоторые данные. Скорее всего, я бы написал что-то вроде этого:

let getAllHyperlinks(url:string) =
    async {  let req = WebRequest.Create(url)
             let! rsp = req.GetResponseAsync()
             use stream = rsp.GetResponseStream()             // depends on rsp
             use reader = new System.IO.StreamReader(stream)  // depends on stream
             let! data = reader.AsyncReadToEnd()              // depends on reader
             return extractAllUrls(data) }                    // depends on data

let! говорит F# выполнить код в другом потоке, затем связать результат с переменной и продолжить обработку. В приведенном выше примере используются два оператора let: один для получения ответа, а другой для чтения всех данных, поэтому он порождает как минимум два потока (пожалуйста, исправьте меня, если я ошибаюсь).

Хотя рабочий процесс выше порождает несколько потоков, порядок выполнения является последовательным, потому что каждый элемент в рабочем процессе зависит от предыдущего элемента. На самом деле невозможно оценить какие-либо элементы дальше в рабочем процессе, пока не вернутся другие потоки.

Есть ли какая-то польза от более чем одного let! в коде выше?

Если нет, то как этот код нужно изменить, чтобы воспользоваться несколькими let! заявления?

2 ответа

Решение

Ключ в том, что мы не создаем никаких новых тем. В течение всего рабочего процесса из ThreadPool используется 1 или 0 активных потоков. (Исключение, вплоть до первого '!', Код выполняется в пользовательском потоке, который выполнил Async.Run.) "Let!" освобождает поток, когда операция Async находится в море, а затем возвращает поток из ThreadPool, когда операция возвращается. Преимущество (производительности) - меньшее давление на ThreadPool (и, конечно, главное преимущество пользователя - простая модель программирования - в миллион раз лучше, чем все то, что вы пишете в BeginFoo / EndFoo / callback).

Смотрите также http://cs.hubfs.net/forums/thread/8262.aspx

Я писал ответ, но Брайан опередил меня. Я полностью согласен с ним.

Я хотел бы добавить, что если вы хотите распараллелить синхронный код, правильным инструментом является PLINQ, а не асинхронные рабочие процессы, как объясняет Дон Сайм.

Другие вопросы по тегам