Визуальная одометрия, набор данных Китти

В настоящее время я пытаюсь сделать стереовизуальную одометрию с использованием Matlab с набором данных KITTI.

Я знаю, что папка poses.txt содержит основные позы истинности (траектории) для первых 11 последовательностей. Каждый файл xx.txt содержит таблицу размером N x 12, где N - количество кадров в этой последовательности. Но что это за 12 параметров? x,y,z, ряд, шаг, рыскание и что?

Мой второй вопрос: если я хочу создать свой собственный набор данных, как я могу получить эти позы с помощью IMU?

2 ответа

Решение

Каждая строка файла содержит первые 3 строки однородной матрицы поз 4x4, сведенные в одну строку.
Это означает, что эта матрица:

r11 r12 r13 tx
r21 r22 r23 ty
r31 r32 r33 tz
0   0   0   1

представлен в файле одной строкой:
r11 r12 r13 tx r21 r22 r23 ty r31 r32 r33 tz
Поищите в Google "однородную матрицу поз 4x4" или прочтите это:
http://homepages.inf.ed.ac.uk/rbf/CVonline/LOCAL_COPIES/MARBLE/high/pose/express.htm
или здесь
https://math.stackexchange.com/questions/82602/how-to-find-camera-position-and-rotation-from-a-4x4-matrix

12 элементов представляют собой уплощенную матрицу 3x4, из которых 3x3 предназначены для вращения, а 3x1 - для перемещения.

Вы можете преобразовать их в другие представления, такие как euler(крен, тангаж, рыскание), кватернион.

Другие вопросы по тегам