Была ли проделана какая-либо работа по обеспечению осведомленности OpenTelemetry GPU? [закрыто]
Фреймворки трассировки только для ЦП, такие как Jaeger (и остальная часть OpenTelemetry, насколько я могу судить), имеют ножное ружье, в котором вы можете создать Span вокруг кода, который порождает (или ожидает) код, выполняющийся асинхронно на графическом процессоре, что приводит к очень вводящим в заблуждение числам в след.
На графических процессорах NVIDIA обычной практикой является использование аннотаций NVTX и запуск кода в среде профилирования, такой как NSight Systems.
Существуют ли какие-либо структуры распределенной трассировки (существующие или планируемые), поддерживающие как CPU, так и GPU?