Google Drive / App Engine для системы управления документами

Я управляю системой управления документами университета. Система является третьей стороной, которая интегрируется с другой сторонней базой данных, которая действует как наша ERP-система. DMS довольно неуклюжий и имеет множество ужасных ошибок / не хватает функций и поддержки. В свое свободное время я поигрался с Google App Engine / Drive SDK из любопытства. Поскольку мы являемся клиентом Google Apps для учебных заведений, у нас неограниченное дисковое пространство, и все наши пользователи являются пользователями приложений Google.

Реально ли создать внутреннее веб-приложение (возможно, с поддержкой Google App Engine), которое использует Drive SDK для управления всеми файлами университета (~ 6 ТБ). Из моих экспериментов, кажется, есть все необходимые возможности.

1 ответ

Решение

Поскольку вы будете создавать свое собственное программное обеспечение, ответ "будет ли он делать то, что я хочу", всегда "да, в конце концов".

Вам нужно будет принять решение о форматах документов, что, в свою очередь, повлияет на ваш механизм индексации. В частности, у вас есть два основных варианта:

  1. конвертировать файлы в форматы документов Google (документы, таблицы и т. д.). После этого вы сможете использовать собственную индексацию и поиск Google, например. как вы бы с drive.gogle.com. Недостатком является то, что форматирование может быть потеряно во время импорта / экспорта туда и обратно.

  2. сохраняйте документы в их родном формате (например, MS .docx) и выполняйте собственную индексацию. Это потребует анализа каждого типа документа, что нетривиально, но я уверен, что есть сторонние библиотеки, чтобы помочь. Положительным моментом является то, что полученные вами документы являются идентичными импортированными вами.

Я думаю, что я бы посмотрел на то, чтобы сделать оба выше. Таким образом, когда вы импортируете файл в свою DMS, вы дважды сохраняете его в Google Drive, конвертируя и не преобразовывая. Используйте хранилище данных App Engine для отслеживания пар. Таким образом, вы можете использовать Поиск диска, чтобы найти преобразованный документ, но файл, который вы отправляете обратно пользователю, является его непревращенным двойником.