Каркас для выполнения распределенных вычислений в облаке.NET

Я думаю о разработке инфраструктуры для упрощения работы распределенных вычислений в облачной среде.NET Windows Azure.

В настоящее время Azure (и, скорее всего, к моменту выпуска) совершенно не подходит для простого запуска распределенных запросов в облаке ( подробности). Просто для меня это что-то вроде DryadLINQ, где вы можете написать запрос:

var results = from c in collection
  where IsLegal(c.Key)
  select new 
  { 
    Key = Hash(c.Key), 
    Result = RunModel(c.Value); 
  };

и выполнить его удаленно на нескольких машинах в кластере. Никаких развертываний, хранилищ или конфигураций.

Какие ресурсы, документы или проекты с открытым исходным кодом вы могли бы посоветовать проверить для получения дополнительной информации по этому вопросу (особенно планирование и оптимизация DAG)?

До сих пор я копался в Hadoop (используется Amazon Elastic Map Reduce) и DryadLINQ. Очевидно, это включает в себя поиск в Google.

1 ответ

В Google Research есть много интересных статей.

MapReduce Paper может быть хорошим местом для начала, если вы еще не прочитали его.

Другие вопросы по тегам