Как получить доступ к существующей (!) Матрице, которая частично содержит неверный синтаксис?
Я использую pdfminer для преобразования pdf-текста в txt. Pdfminer просматривает pdf-файл и читает его построчно. Каждая строка присваивается матричной переменной. Проблема в том, что по некоторым причинам в редких случаях матрица, например, для x =
[[Г, 'problems', -436, 'have', -448, 'usually', -435, 'found', -452]]
Очевидно, Г без кавычек является недопустимым синтаксисом для матрицы (или списка). Однакоx существует, но не доступен для удаления Г, по понятным причинам del x[0][0] не работает.
Теперь я прошу идеи, как получить доступ к x и удалить первый элемент. Спасибо заранее!
1 ответ
Решение
Я решил свою проблему с:
from ast import literal_eval
mr_x = str(x)
quote_pos = mr_x.find("'")
mr_x = '[[' + mr_x[quote_pos:]
x = literal_eval(mr_x)
print x
[['problems', -436, 'have', -448, 'usually', -435, 'found', -452]]