Доступ к содержимому файла Word(.docx) с помощью Microsoft Graph REST API?

Есть ли способ получить содержимое документа Word, хранящегося в облаке, через API Microsoft Graph без необходимости загружать файл локально?

Цель состоит в том, чтобы создать приложение, которое анализирует внутреннее содержимое документа Word и создает из него некоторые интересные данные. Однако после поиска в Microsoft Dev Center, Graph Explorer и хранилище документации их API, я не могу найти какие-либо конечные точки API, которые могли бы обслуживать эти данные.

Я могу найти некоторые конечные точки, которые имеют дело с манипулированием содержимым Excel, но не те, которые имеют дело с Word. Разве Microsoft Graph не поддерживает извлечение содержимого документа Word?

РЕДАКТИРОВАТЬ: Например, я знаю, что могу прочитать содержимое "сообщения" и даже применить поиск по параметрам запроса, как продемонстрировал один из примеров Microsoft. Но я не могу найти, как это сделать с документами Word.

1 ответ

Что ж, можно скачать содержимое документа. См.: Загрузите содержимое DriveItem.

Например:

GET /v1.0/me/drive/root:/some-folder/document.docx:/content

Но вы получите весь docx со встроенными изображениями и всем остальным. Не знаю, ищете ли вы это.


В качестве примера рассмотрим проект helix-word2md, который извлекает docx и преобразует его в уценку.

Боюсь, вы не можете напрямую получить доступ к содержанию слов. Что вы можете сделать, это использовать свойство веб-URL DriveItem, открывая документ, связанный Word Online или родной мир, если он установлен. Вы можете использовать это ниже, чтобы показать определенный элемент или все элементы:

GET /users/{userId}/drive/items/{itemId}
GET me/drive/root/children/

Это результат ниже:

{
    "@microsoft.graph.downloadUrl": "",
    "createdDateTime": "2018-08-10T01:43:00Z",
    "eTag": "\"{00000000-3E94-4161-9B82-0000000},2\"",
    "id": "00000000IOJA4ONFB6MFAZXARX7L7RU4NV",
    "lastModifiedDateTime": "2018-08-10T01:43:00Z",
    "name": "daily check.docx",
    "webUrl": "https://xxxxxxx",
    "cTag": "\"c:{00000000-3E94-4161-9B82-37FAFF1A71B5},2\"",
    "size": 26330,
    "createdBy": {
        "user": {
            "email": "000000.onmicrosoft.com",
            "id": "000000-93dc-41b7-b89b-760c4128455a",
            "displayName": "Chris"
        }
    },
    "lastModifiedBy": {
        "user": {
            "email": "0000@0000.onmicrosoft.com",
            "id": "00000000-93dc-41b7-b89b-00000000",
            "displayName": "Chris"
        }
    },
    "parentReference": {
        "driveId": 
   "b!000000000gdQMtns72t31yqWMhnFCjmCqO3tR5ypOf17NKl2USqo1bNqhOzrZ",
        "driveType": "business",
        "id": "00000VN6Y2GOVW7725BZO354PWSELRRZ",
        "path": "/drive/root:"
    },
    "file": {
        "mimeType": "application/vnd.openxmlformats- 
   officedocument.wordprocessingml.document",
        "hashes": {
            "quickXorHash": "OSOK7r2hIVSeY1+FjaCnlOxn2p8="
        }
    },
    "fileSystemInfo": {
        "createdDateTime": "2018-08-10T01:43:00Z",
        "lastModifiedDateTime": "2018-08-10T01:43:00Z"
    }
}
Другие вопросы по тегам