Лучшие практики для распараллеливания с использованием асинхронного рабочего процесса
Допустим, я хотел почистить веб-страницу и извлечь некоторые данные. Скорее всего, я бы написал что-то вроде этого:
let getAllHyperlinks(url:string) =
async { let req = WebRequest.Create(url)
let! rsp = req.GetResponseAsync()
use stream = rsp.GetResponseStream() // depends on rsp
use reader = new System.IO.StreamReader(stream) // depends on stream
let! data = reader.AsyncReadToEnd() // depends on reader
return extractAllUrls(data) } // depends on data
let!
говорит F# выполнить код в другом потоке, затем связать результат с переменной и продолжить обработку. В приведенном выше примере используются два оператора let: один для получения ответа, а другой для чтения всех данных, поэтому он порождает как минимум два потока (пожалуйста, исправьте меня, если я ошибаюсь).
Хотя рабочий процесс выше порождает несколько потоков, порядок выполнения является последовательным, потому что каждый элемент в рабочем процессе зависит от предыдущего элемента. На самом деле невозможно оценить какие-либо элементы дальше в рабочем процессе, пока не вернутся другие потоки.
Есть ли какая-то польза от более чем одного let!
в коде выше?
Если нет, то как этот код нужно изменить, чтобы воспользоваться несколькими let!
заявления?
2 ответа
Ключ в том, что мы не создаем никаких новых тем. В течение всего рабочего процесса из ThreadPool используется 1 или 0 активных потоков. (Исключение, вплоть до первого '!', Код выполняется в пользовательском потоке, который выполнил Async.Run.) "Let!" освобождает поток, когда операция Async находится в море, а затем возвращает поток из ThreadPool, когда операция возвращается. Преимущество (производительности) - меньшее давление на ThreadPool (и, конечно, главное преимущество пользователя - простая модель программирования - в миллион раз лучше, чем все то, что вы пишете в BeginFoo / EndFoo / callback).
Смотрите также http://cs.hubfs.net/forums/thread/8262.aspx
Я писал ответ, но Брайан опередил меня. Я полностью согласен с ним.
Я хотел бы добавить, что если вы хотите распараллелить синхронный код, правильным инструментом является PLINQ, а не асинхронные рабочие процессы, как объясняет Дон Сайм.