OpenGL OGLDev SSAO Руководство по внедрению Фрагмент шейдера дает шум
ЗАДАЧА ЗАДАЧИ
Я пытаюсь внедрить SSAO после OGLDev Tutorial 45, который основан на Tutorial Джона Чепмена. Учебное пособие OGLDev использует очень упрощенный метод, который выбирает случайные точки в радиусе вокруг позиции фрагмента и увеличивает коэффициент AO в зависимости от того, сколько точек выборки имеют глубину, превышающую фактическую глубину поверхности, сохраненную в этом месте (чем больше позиций вокруг фрагмента лежат перед ним тем сильнее окклюзия).
"Механизм", который я использую, не имеет такого модульного отложенного затенения, как OGLDev, но в основном он сначала отображает все цвета экрана в кадровый буфер с вложением текстуры и вложенным буфером глубины. Чтобы сравнить глубины, позиции пространства вида фрагмента визуализируются в другой кадровый буфер с вложением текстуры. Затем эти текстуры обрабатываются шейдером SSAO, и результат выводится в квад для заполнения экрана. Обе текстуры сами по себе хорошо рисуют на квадре, и входная униформа шейдеров, кажется, тоже в порядке, поэтому я не включил код движка.
Фрагментный шейдер практически идентичен, как вы можете видеть ниже. Я включил некоторые комментарии, которые служат моему личному пониманию.
#version 330 core
in vec2 texCoord;
layout(location = 0) out vec4 outColor;
const int RANDOM_VECTOR_ARRAY_MAX_SIZE = 128; // reference uses 64
const float SAMPLE_RADIUS = 1.5f; // TODO: play with this value, reference uses 1.5
uniform sampler2D screenColorTexture; // the whole rendered screen
uniform sampler2D viewPosTexture; // interpolated vertex positions in view space
uniform mat4 projMat;
// we use a uniform buffer object for better performance
layout (std140) uniform RandomVectors
{
vec3 randomVectors[RANDOM_VECTOR_ARRAY_MAX_SIZE];
};
void main()
{
vec4 screenColor = texture(screenColorTexture, texCoord).rgba;
vec3 viewPos = texture(viewPosTexture, texCoord).xyz;
float AO = 0.0;
// sample random points to compare depths around the view space position.
// the more sampled points lie in front of the actual depth at the sampled position,
// the higher the probability of the surface point to be occluded.
for (int i = 0; i < RANDOM_VECTOR_ARRAY_MAX_SIZE; ++i) {
// take a random sample point.
vec3 samplePos = viewPos + randomVectors[i];
// project sample point onto near clipping plane
// to find the depth value (i.e. actual surface geometry)
// at the given view space position for which to compare depth
vec4 offset = vec4(samplePos, 1.0);
offset = projMat * offset; // project onto near clipping plane
offset.xy /= offset.w; // perform perspective divide
offset.xy = offset.xy * 0.5 + vec2(0.5); // transform to [0,1] range
float sampleActualSurfaceDepth = texture(viewPosTexture, offset.xy).z;
// compare depth of random sampled point to actual depth at sampled xy position:
// the function step(edge, value) returns 1 if value > edge, else 0
// thus if the random sampled point's depth is greater (lies behind) of the actual surface depth at that point,
// the probability of occlusion increases.
// note: if the actual depth at the sampled position is too far off from the depth at the fragment position,
// i.e. the surface has a sharp ridge/crevice, it doesnt add to the occlusion, to avoid artifacts.
if (abs(viewPos.z - sampleActualSurfaceDepth) < SAMPLE_RADIUS) {
AO += step(sampleActualSurfaceDepth, samplePos.z);
}
}
// normalize the ratio of sampled points lying behind the surface to a probability in [0,1]
// the occlusion factor should make the color darker, not lighter, so we invert it.
AO = 1.0 - AO / float(RANDOM_VECTOR_ARRAY_MAX_SIZE);
///
outColor = screenColor + mix(vec4(0.2), vec4(pow(AO, 2.0)), 1.0);
/*/
outColor = vec4(viewPos, 1); // DEBUG: draw view space positions
//*/
}
ЧТО РАБОТАЕТ?
- Фрагмент цвета текстуры правильный.
- Координаты текстуры - это координаты квадрата заполнения экрана, в который мы рисуем, и преобразуются в [0, 1]. Они дают эквивалентные результаты как
vec2 texCoord = gl_FragCoord.xy / textureSize(screenColorTexture, 0);
- (Перспективная) матрица проекции - это та, которую использует камера, и она работает для этой цели. В любом случае, похоже, это не проблема.
- Компоненты вектора случайной выборки находятся в диапазоне [-1, 1], как и предполагалось.
- Фрагмент видовой текстуры пространственных позиций выглядит нормально:
В ЧЕМ ДЕЛО?
Когда я устанавливаю коэффициент микширования AO в нижней части фрагмента шейдера на 0, он работает плавно до предела fps (хотя вычисления все еще выполняются, по крайней мере, я предполагаю, что компилятор не оптимизирует это:D). Но когда AO смешивается, для прорисовки кадра требуется до 80 мс (замедляется со временем, как если бы буферы заполнялись), и результат действительно интересный и запутанный:
Очевидно, что отображение кажется далеким, и мерцающий шум кажется очень случайным, как если бы он непосредственно соответствовал векторам случайной выборки. Мне показалось наиболее интересным, что время прорисовки значительно увеличилось только при добавлении коэффициента АО, а не из-за вычисления окклюзии. Есть ли проблема в буферах отрисовки?
1 ответ
Похоже, что проблема связана с выбранными типами текстур.
Текстура с ручкой viewPosTexture
необходимо явно определить как формат текстуры с плавающей точкой GL_RGB16F
или же GL_RGBA32F
вместо просто GL_RGB
, Интересно, что отдельные текстуры были нарисованы отлично, проблемы возникали только в комбинации.
// generate screen color texture
// note: GL_NEAREST interpolation is ok since there is no subpixel sampling anyway
glGenTextures(1, &screenColorTexture);
glBindTexture(GL_TEXTURE_2D, screenColorTexture);
glTexParameteri(GL_TEXTURE_2D, GL_TEXTURE_WRAP_S, GL_CLAMP_TO_EDGE);
glTexParameteri(GL_TEXTURE_2D, GL_TEXTURE_WRAP_T, GL_CLAMP_TO_EDGE);
glTexParameteri(GL_TEXTURE_2D, GL_TEXTURE_MIN_FILTER, GL_NEAREST);
glTexParameteri(GL_TEXTURE_2D, GL_TEXTURE_MAG_FILTER, GL_NEAREST);
glTexImage2D(GL_TEXTURE_2D, 0, GL_RGB, windowWidth, windowHeight, 0, GL_BGR, GL_UNSIGNED_BYTE, NULL);
// generate depth renderbuffer. without this, depth testing wont work.
// we use a renderbuffer since we wont have to sample this, opengl uses it directly.
glGenRenderbuffers(1, &screenDepthBuffer);
glBindRenderbuffer(GL_RENDERBUFFER, screenDepthBuffer);
glRenderbufferStorage(GL_RENDERBUFFER, GL_DEPTH_COMPONENT, windowWidth, windowHeight);
// generate vertex view space position texture
glGenTextures(1, &viewPosTexture);
glBindTexture(GL_TEXTURE_2D, viewPosTexture);
glTexParameteri(GL_TEXTURE_2D, GL_TEXTURE_WRAP_S, GL_CLAMP_TO_EDGE);
glTexParameteri(GL_TEXTURE_2D, GL_TEXTURE_WRAP_T, GL_CLAMP_TO_EDGE);
glTexParameteri(GL_TEXTURE_2D, GL_TEXTURE_MIN_FILTER, GL_NEAREST);
glTexParameteri(GL_TEXTURE_2D, GL_TEXTURE_MAG_FILTER, GL_NEAREST);
glTexImage2D(GL_TEXTURE_2D, 0, GL_RGBA32F, windowWidth, windowHeight, 0, GL_BGRA, GL_UNSIGNED_BYTE, NULL);
Медленное рисование может быть вызвано функцией микширования GLSL. Будем расследовать дальше об этом.
Мерцание было связано с регенерацией и передачей новых случайных векторов в каждом кадре. Достаточно просто передать достаточно случайных векторов, чтобы решить проблему. В противном случае это может помочь размыть результаты SSAO.
В основном, SSAO работает сейчас! Теперь это просто более или менее очевидные ошибки.