Как агрегировать градиенты от параллельных рабочих в распределенном тензорном потоке непростым средним способом?

Я новичок в распределенном тензорном потоке, я хочу накапливать градиенты от параллельных рабочих на каждой итерации по-разному с помощью SyncReplicasOptimizer(), например, средневзвешенного значения или вычисления среднего геометрического значения Graititns, как я могу это реализовать.