Что такое семафор?

Семафор - это концепция программирования, которая часто используется для решения многопоточных задач. Мой вопрос к сообществу:

Что такое семафор и как вы его используете?

16 ответов

Думайте о семафорах как о вышибалах в ночном клубе. В клубе разрешено сразу несколько человек. Если клуб заполнен, никому не разрешается входить, но как только один человек уходит, другой человек может войти.

Это просто способ ограничить количество потребителей для конкретного ресурса. Например, чтобы ограничить количество одновременных обращений к базе данных в приложении.

Вот очень педагогический пример на C#:-)

using System;
using System.Collections.Generic;
using System.Text;
using System.Threading;

namespace TheNightclub
{
    public class Program
    {
        public static Semaphore Bouncer { get; set; }

        public static void Main(string[] args)
        {
            // Create the semaphore with 3 slots, where 3 are available.
            Bouncer = new Semaphore(3, 3);

            // Open the nightclub.
            OpenNightclub();
        }

        public static void OpenNightclub()
        {
            for (int i = 1; i <= 50; i++)
            {
                // Let each guest enter on an own thread.
                Thread thread = new Thread(new ParameterizedThreadStart(Guest));
                thread.Start(i);
            }
        }

        public static void Guest(object args)
        {
            // Wait to enter the nightclub (a semaphore to be released).
            Console.WriteLine("Guest {0} is waiting to entering nightclub.", args);
            Bouncer.WaitOne();          

            // Do some dancing.
            Console.WriteLine("Guest {0} is doing some dancing.", args);
            Thread.Sleep(500);

            // Let one guest out (release one semaphore).
            Console.WriteLine("Guest {0} is leaving the nightclub.", args);
            Bouncer.Release(1);
        }
    }
}

Статья Mutexes и семафоры, демистифицированные Майклом Барром, является отличным кратким введением в то, что отличает мьютексы и семафоры, и когда они должны и не должны использоваться. Я выдержал несколько ключевых параграфов здесь.

Ключевым моментом является то, что мьютексы должны использоваться для защиты общих ресурсов, а семафоры - для сигнализации. Как правило, не следует использовать семафоры для защиты общих ресурсов или мьютексы для передачи сигналов. Например, существуют проблемы с аналогией с вышибалами в плане использования семафоров для защиты общих ресурсов - вы можете использовать их таким образом, но это может привести к трудной диагностике ошибок.

Хотя мьютексы и семафоры имеют некоторые сходства в своей реализации, они всегда должны использоваться по-разному.

Наиболее распространенный (но, тем не менее, неправильный) ответ на вопрос, поставленный сверху, состоит в том, что мьютексы и семафоры очень похожи, с единственным существенным отличием в том, что семафоры могут считать больше единицы. Похоже, что почти все инженеры правильно понимают, что мьютекс - это двоичный флаг, используемый для защиты общего ресурса путем обеспечения взаимного исключения внутри критических разделов кода. Но когда их просят рассказать о том, как использовать "семафор подсчета", большинство инженеров, различающихся только степенью достоверности, выражают некоторую разновидность мнения учебника о том, что они используются для защиты нескольких эквивалентных ресурсов.

...

На этом этапе проводится интересная аналогия с использованием идеи ключей ванной комнаты для защиты общих ресурсов - ванной комнаты. Если в магазине имеется одна ванная комната, то одного ключа будет достаточно для защиты этого ресурса и предотвращения одновременного использования его несколькими людьми.

Если есть несколько ванных комнат, может возникнуть соблазн набрать их одинаково и создать несколько ключей - это похоже на то, что семафор используется не по назначению. Когда у вас есть ключ, вы на самом деле не знаете, какая ванная комната доступна, и если вы пойдете по этому пути, вы, вероятно, в конечном итоге будете использовать мьютексы для предоставления этой информации и убедитесь, что вы не берете ванную, которая уже занята.,

Семафор - неправильный инструмент для защиты нескольких практически одинаковых ресурсов, но именно так многие думают и используют его. Аналогия с вышибалами совершенно иная: не существует нескольких ресурсов одного типа, вместо этого есть один ресурс, который может принимать одновременно нескольких пользователей. Я полагаю, что семафор может использоваться в таких ситуациях, но редко бывают ситуации реального мира, где аналогия действительно имеет место - чаще всего есть несколько таких же типов, но все же отдельные ресурсы, такие как ванные комнаты, которые не могут быть использованы сюда.

...

Правильное использование семафора для передачи сигналов от одной задачи к другой. Мьютекс предназначен для взятия и освобождения, всегда в таком порядке, каждой задачей, которая использует общий ресурс, который он защищает. Напротив, задачи, которые используют семафоры, либо сигнализируют, либо ждут, но не оба. Например, Задача 1 может содержать код для публикации (т. Е. Сигнала или приращения) определенного семафора, когда нажата кнопка "питание", и Задача 2, которая активирует отображение, ожидает этого же семафора. В этом сценарии одна задача является источником сигнала события; другой потребитель.

...

Здесь важно отметить, что мьютексы плохо взаимодействуют с операционными системами реального времени, вызывая инверсию приоритетов, когда менее важная задача может быть выполнена перед более важной задачей из-за совместного использования ресурсов. Короче говоря, это происходит, когда задача с более низким приоритетом использует мьютекс для захвата ресурса A, затем пытается захватить B, но приостанавливается, потому что B недоступен. В то время как это ожидает, задача с более высоким приоритетом приходит и нуждается в A, но она уже связана, и процессом, который даже не работает, потому что он ожидает B. Есть много способов решить эту проблему, но чаще всего это исправлено изменив мьютекс и диспетчер задач. В этих случаях мьютекс является гораздо более сложным, чем двоичный семафор, и использование семафора в таком случае приведет к инверсии приоритетов, поскольку диспетчер задач не знает об инверсии приоритетов и не может ее исправить.

...

Причина широко распространенной современной путаницы между мьютексами и семафорами является исторической, поскольку она восходит к 1974 году, когда был изобретен Семафор (заглавная "S" в этой статье) Джикстра. До этой даты ни один из механизмов синхронизации задач и сигнализации с защитой от прерываний, известных компьютерным ученым, не был эффективно масштабируемым для использования более чем двумя задачами. Революционный, безопасный и масштабируемый семафор Дейкстры был применен как для защиты критических участков, так и для сигнализации. И так началась неразбериха.

Однако впоследствии разработчикам операционных систем стало очевидно, что после появления приоритетной ОСРВ на основе приоритетов (например, VRTX, ок. 1980 г.), публикации научных работ, устанавливающих RMA и проблем, вызванных инверсией приоритетов, и документа о приоритетах Протоколы наследования в 1990 году 3 показали, что мьютексы должны быть чем-то большим, чем просто семафоры с двоичным счетчиком.

Mutex: обмен ресурсами

Семафор: сигнализация

Не используйте один для другого без тщательного рассмотрения побочных эффектов.

Mutex: эксклюзивный доступ к ресурсу

Семафор: n-членский доступ к ресурсу

То есть мьютекс может использоваться для синхронизации доступа к счетчику, файлу, базе данных и т. Д.

Семафор может делать то же самое, но поддерживает фиксированное количество одновременных абонентов. Например, я могу обернуть свои вызовы базы данных в семафор (3), чтобы мое многопоточное приложение попадало в базу данных не более чем с 3 одновременными соединениями. Все попытки будут заблокированы, пока не откроется один из трех слотов. Они делают такие вещи, как наивное регулирование, очень легко.

Рассмотрим такси, которое может вместить в общей сложности 3(сзади)+2(впереди) человека, включая водителя. Итак, semaphore позволяет только 5 человек в машине одновременно. И mutex позволяет только 1 человек на одном сиденье автомобиля.

Следовательно, Mutex разрешить монопольный доступ к ресурсу (например, к потоку ОС), пока Semaphore это разрешить доступ к n количеству ресурсов одновременно.

@Craig:

Семафор - это способ блокировки ресурса, так что гарантируется, что при выполнении фрагмента кода только этот фрагмент кода имеет доступ к этому ресурсу. Это предотвращает одновременный доступ двух ресурсов к ресурсу, что может вызвать проблемы.

Это не ограничено только одним потоком. Семафор можно настроить так, чтобы разрешить фиксированному количеству потоков доступ к ресурсу.

Семафор также можно использовать как... семафор. Например, если у вас есть несколько процессов, помещающих данные в очередь, и только одна задача, потребляющая данные из очереди. Если вы не хотите, чтобы ваша задача-потребитель постоянно опрашивала очередь на наличие доступных данных, вы можете использовать семафор.

Здесь семафор используется не как механизм исключения, а как механизм сигнализации. Задача потребления ожидает семафора. Производящая задача размещается на семафоре.

Таким образом, задача потребления выполняется тогда и только тогда, когда есть данные, подлежащие удалению

Существуют две основные концепции создания параллельных программ - синхронизация и взаимное исключение. Мы увидим, как эти два типа блокировок (семафоры, в более общем смысле, являются своего рода механизмом блокировки) помогают нам добиться синхронизации и взаимного исключения.

Семафор - это программная конструкция, которая помогает нам достичь параллелизма за счет реализации как синхронизации, так и взаимного исключения. Семафоры бывают двух типов: двоичные и счетные.

Семафор состоит из двух частей: счетчика и списка задач, ожидающих доступа к определенному ресурсу. Семафор выполняет две операции: wait (P) [это похоже на получение блокировки] и release (V)[аналогично освобождению блокировки] - это единственные две операции, которые можно выполнить с семафором. В двоичном семафоре счетчик логически переходит от 0 до 1. Вы можете думать, что он похож на блокировку с двумя значениями: открыт / закрыт. Счетный семафор имеет несколько значений для счета.

Важно понимать, что счетчик семафоров отслеживает количество задач, которые не нужно блокировать, т. Е. Они могут добиться прогресса. Задачи блокируются и добавляются в список семафоров только тогда, когда счетчик равен нулю. Следовательно, задача добавляется в список в процедуре P(), если она не может быть выполнена, и "освобождается" с помощью процедуры V ().

Теперь совершенно очевидно, что двоичные семафоры можно использовать для решения задач синхронизации и взаимоисключения - по сути, это блокировки.

ех. Синхронизация:

thread A{
semaphore &s; //locks/semaphores are passed by reference! think about why this is so.
A(semaphore &s): s(s){} //constructor
foo(){
...
s.P();
;// some block of code B2
...
}

//thread B{
semaphore &s;
B(semaphore &s): s(s){} //constructor
foo(){
...
...
// some block of code B1
s.V();
..
}

main(){
semaphore s(0); // we start the semaphore at 0 (closed)
A a(s);
B b(s);
}

В приведенном выше примере B2 может выполняться только после того, как B1 завершил выполнение. Предположим, что поток A выполняется, выполняется первым - получает sem.P () и ждет, так как счетчик равен 0 (закрыт). Приходит поток B, завершается B1, а затем освобождается поток A, который затем завершает B2. Таким образом, мы достигаем синхронизации.

Теперь давайте посмотрим на взаимное исключение с помощью двоичного семафора:

thread mutual_ex{
semaphore &s;
mutual_ex(semaphore &s): s(s){} //constructor
foo(){
...
s.P();
//critical section
s.V();
...
...
s.P();
//critical section
s.V();
...

}

main(){
semaphore s(1);
mutual_ex m1(s);
mutual_ex m2(s);
}

Взаимное исключение также довольно просто - m1 и m2 не могут одновременно войти в критическую секцию. Таким образом, каждый поток использует один и тот же семафор, чтобы обеспечить взаимное исключение для его двух критических секций. Теперь возможно ли иметь больший параллелизм? Зависит от критических разделов. (Подумайте, как еще можно использовать семафоры для достижения взаимного исключения. Подсказка: мне обязательно нужно использовать только один семафор?)

Подсчет семафора: семафор с более чем одним значением. Давайте посмотрим, что это означает - блокировка с более чем одним значением? Так открыто, закрыто и... хм. Какая польза от многоступенчатой ​​блокировки во взаимном исключении или синхронизации?

Давайте возьмем самое простое из двух:

Синхронизация с использованием счетного семафора. Допустим, у вас есть 3 задачи - № 1 и 2, которые вы хотите выполнить после 3. Как бы вы разработали свою синхронизацию?

thread t1{
...
s.P();
//block of code B1

thread t2{
...
s.P();
//block of code B2

thread t3{
...
//block of code B3
s.V();
s.V();
}

Таким образом, если ваш семафор начинается закрытым, вы гарантируете, что блоки t1 и t2 будут добавлены в список семафоров. Затем приходит все важное t3, заканчивает свою деятельность и освобождает t1 и t2. В каком порядке они освобождены? Зависит от реализации списка семафоров. Может быть FIFO, может быть определен какой-то конкретный приоритет и т. Д. (Примечание: подумайте, как бы вы расположили свои P и V; если вы хотите, чтобы t1 и t2 выполнялись в каком-то определенном порядке, и если вы не знали о реализации семафора)

(Узнайте: что произойдет, если число V больше, чем число P?)

Взаимное исключение Использование счетных семафоров: я хотел бы, чтобы вы создали для этого свой собственный псевдокод (помогает вам лучше понимать вещи!), Но фундаментальная концепция такова: счетный семафор counter = N позволяет N задачам свободно входить в критическую секцию, Это означает, что у вас есть N задач (или потоков, если хотите), попадающих в критическую секцию, но N+1-я задача блокируется (входит в наш любимый список заблокированных задач) и пропускается только тогда, когда кто-то из V семафор. Хотя бы один раз. Таким образом, счетчик семафоров, вместо того, чтобы колебаться между 0 и 1, теперь идет между 0 и N, позволяя N задачам свободно входить и выходить, не блокируя никого!

Черт возьми, зачем тебе такая глупость? Разве не весь смысл взаимного исключения, чтобы не позволить больше чем одному парню получить доступ к ресурсу?? (Подсказка Подсказка... у вас не всегда есть только один диск на вашем компьютере, не так ли?...)

Задуматься: достигнуто ли взаимное исключение только с помощью счетного семафора? Что если у вас есть 10 экземпляров ресурса и 10 потоков входят (через счетный семафор) и пытаются использовать первый экземпляр?

Я создал визуализацию, которая должна помочь понять идею. Семафор контролирует доступ к общему ресурсу в многопоточной среде.

ExecutorService executor = Executors.newFixedThreadPool(6);

Semaphore semaphore = new Semaphore(4);

Runnable longRunningTask = () -> {
    boolean permit = false;
    try {
        permit = semaphore.tryAcquire(1, TimeUnit.SECONDS);
        if (permit) {
            System.out.println("Semaphore acquired");
            Thread.sleep(5);
        } else {
            System.out.println("Could not acquire semaphore");
        }
    } catch (InterruptedException e) {
        throw new IllegalStateException(e);
    } finally {
        if (permit) {
            semaphore.release();
        }
    }
};

// execute tasks
for (int j = 0; j < 10; j++) {
    executor.submit(longRunningTask);
}
executor.shutdown();

Выход

Semaphore acquired
Semaphore acquired
Semaphore acquired
Semaphore acquired
Could not acquire semaphore
Could not acquire semaphore

Пример кода из другой статьи

Семафор - это объект, содержащий натуральное число (т. Е. Целое число, большее или равное нулю), для которого определены две модифицирующие операции. Одна операция, V, добавляет 1 к естественному. Другая операция, P, уменьшает натуральное число на 1. Оба действия являются атомарными (т.е. никакая другая операция не может быть выполнена одновременно с V или P).

Поскольку натуральный номер 0 не может быть уменьшен, вызывающий P на семафоре, содержащем 0, будет блокировать выполнение вызывающего процесса (/thread) до некоторого момента, когда число больше не будет 0, и P может быть успешно (и атомарно) выполнено.

Как упоминалось в других ответах, семафоры могут использоваться для ограничения доступа к определенному ресурсу максимальным (но переменным) числом процессов.

Семафоры действуют как ограничители потоков.

Пример: если у вас есть пул из 100 потоков, и вы хотите выполнить какую-либо операцию с БД. Если 100 потоков обращаются к БД в определенный момент времени, то в БД может быть проблема блокировки, поэтому мы можем использовать семафор, который допускает только ограниченный поток за раз. Когда поток вызывает acquire() метод, он получит доступ и после вызова release() метод, он освободит доступ, так что следующий поток получит доступ.

    package practice;
    import java.util.concurrent.Semaphore;

    public class SemaphoreExample {
        public static void main(String[] args) {
            Semaphore s = new Semaphore(1);
            semaphoreTask s1 = new semaphoreTask(s);
            semaphoreTask s2 = new semaphoreTask(s);
            semaphoreTask s3 = new semaphoreTask(s);
            semaphoreTask s4 = new semaphoreTask(s);
            semaphoreTask s5 = new semaphoreTask(s);
            s1.start();
            s2.start();
            s3.start();
            s4.start();
            s5.start();
        }
    }

    class semaphoreTask extends Thread {
        Semaphore s;
        public semaphoreTask(Semaphore s) {
            this.s = s;
        }
        @Override
        public void run() {
            try {
                s.acquire();
                Thread.sleep(1000);
                System.out.println(Thread.currentThread().getName()+" Going to perform some operation");
                s.release();
            } catch (InterruptedException e) {
                e.printStackTrace();
            }
        } 
    }

Аппаратный или программный флаг. В многозадачных системах семафор представляет собой переменную со значением, которое указывает состояние общего ресурса. Процесс, которому требуется ресурс, проверяет семафор, чтобы определить состояние ресурсов, а затем решает, как поступить.

Итак, представьте, что все пытаются пойти в ванную, а в ванной есть только определенное количество ключей. Теперь, если ключей недостаточно, этот человек должен подождать. Поэтому представьте, что семафор представляет набор ключей, доступных для ванных комнат (системных ресурсов), к которым могут обращаться различные процессы (посетители ванных).

Теперь представьте два процесса, пытающихся одновременно пойти в ванную. Это не очень хорошая ситуация, и для предотвращения этого используются семафоры. К сожалению, семафор является добровольным механизмом, и процессы (наши посетители в ванной комнате) могут его игнорировать (т. Е. Даже если есть ключи, кто-то может все же просто открыть дверь).

Есть также различия между двоичным / мьютексом и счетными семафорами.

Ознакомьтесь с примечаниями к лекциям по адресу http://www.cs.columbia.edu/~jae/4118/lect/L05-ipc.html.

Дейкстра предложил семафор в 1965 году. Это важный метод управления параллельным процессом с использованием целочисленного значения. Он известен как « Семафор ». Переменная, которая не является отрицательной и разделяется между потоками, называется Semaphore.

Эта переменная используется для решения проблемы критического сечения. а также для достижения синхронизации процессов в многопроцессорных средах.

Существует два типа семафоров:

  1. Двоичный семафор
  2. Подсчет семафоров

Двоичный семафор: это также называется блокировкой мьютекса. Он может иметь только два значения: 0 и 1. Его начальное значение - 1. Он используется для решения проблем критических секций с использованием нескольких процессов.

Подсчет семафора: его значение можно использовать для управления доступом к любому домену. Его можно использовать для ограничения доступа к ресурсам несколькими экземплярами.

Это старый вопрос, но одно из самых интересных применений семафора - блокировка чтения / записи, и она не упоминалась явно.

Р / ж замки работают простым способом: потребляют одно разрешение для читателя и все разрешения для писателей. Действительно, тривиальная реализация блокировки ar / w, но требует модификации метаданных при чтении (фактически дважды), которая может стать узким местом, все же значительно лучше, чем мьютекс или блокировка.

Другим недостатком является то, что авторы могут запускаться довольно легко, если только семафор не является справедливым или записи не получают разрешения в нескольких запросах, в этом случае им нужен явный мьютекс между собой.

Далее читайте:

Мьютекс — это просто логическое значение, а семафор — это счетчик.

Оба используются для блокировки части кода, чтобы к нему не обращались слишком много потоков.

Пример

      lock.set()
a += 1
lock.unset()

Теперь, если был мьютекс, это означает, что он всегда будет заблокирован или разблокирован (логическое значение под поверхностью), независимо от того, сколько потоков пытается получить доступ к защищенному фрагменту кода. Пока он заблокирован, любой другой поток будет просто ждать, пока он не будет разблокирован/сброшен предыдущим потоком.

А теперь представьте, если вместо lockбыл под капотом счетчик с предопределенным значением MAX (скажем, 2 для нашего примера). Затем, если 2 потока попытаются получить доступ к ресурсу, значение блокировки увеличится до 2. Если 3-й поток затем попытается получить к нему доступ, он просто подождет, пока счетчик не упадет ниже 2 и так далее.

Если бы блокировка как семафор имела максимальное значение 1, то она действовала бы точно так же, как мьютекс.

Семафор - это способ блокировки ресурса, так что гарантируется, что при выполнении фрагмента кода только этот фрагмент кода имеет доступ к этому ресурсу. Это предотвращает одновременный доступ двух ресурсов к ресурсу, что может вызвать проблемы.

Другие вопросы по тегам