Лучший язык для создания сценариев крупномасштабного управления файлами
Программа Natural Sounds Службы национальных парков собирает несколько терабайт данных каждый год для измерения звуковых сцен. По вашему мнению, какой язык скриптов лучше всего подходит для управления огромным количеством файлов и типов файлов? Мы хотели бы легко разрабатывать и запускать эффективные удобные сценарии для поиска и извлечения / создания копий файлов, которые могут находиться в разных каталогах в соответствии с единой статической иерархией. ОС, скорее всего, будет Windows. Спасибо!
3 ответа
Используйте тот, с которым ваши разработчики больше всего знакомы. Повышение производительности, которое вы получите от этого, почти наверняка превзойдет любые преимущества, которые один язык может иметь над другим.
Используйте Python. Это легко учиться. Каждый может легко конвертировать.
Размер файлов не имеет большого значения, когда вы ищете каталоги или ищете метаданные вне файлов. Тем не менее, вам редко нужно читать весь файл звукового примера, чтобы убрать метаданные.
Кроме того, если вы делаете это часто, вы можете рассмотреть
Извлечь все метаданные в реляционную базу данных.
Используйте реляционную базу данных как сложный "индекс" для файлов сэмплов.
Каждое добавление или изменение файла будет выполняться через приложение, которое синхронизирует изменения файла с обновлениями базы данных, чтобы гарантировать, что индекс базы данных действительно соответствует файловой системе.
Большая часть ваших запросов может стать запросами SQL.
Я действительно не знаю, что вы будете искать на языке сценариев, но Эрик прав, что вы должны использовать то, с чем знакомы все ваши разработчики. Однако, если у вас нет разработчиков (пока) и вы разрабатываете проект (и команду) с нуля, C++ или.Net (C# или VB).
В то время как C++ предлагает более мощное программирование и производительность, C# и VB.Net предлагают более быстрое производство. Независимо от производственных преимуществ.Net, я думаю, что для огромного количества файлов и типов файлов вы получите наибольшее общее удовлетворение от C++. На мой взгляд, лучший дружественный дизайн требует очень небольшого количества пользовательского ввода, кроме нажатия кнопок или выбора параметров из списка.