Автоматизировать классификацию программного обеспечения с помощью Python

Можно ли построить программу для привязки "тегов" к определенному программному обеспечению? У меня есть список >1000 названия программ, которые необходимо классифицировать с помощью связанных тегов. Например, для программного обеспечения "MS Lync" Сначала я должен выполнить поиск в Интернете (Google) и просмотреть содержимое каждого возвращенного URL-адреса, чтобы понять его назначение, и, наконец, связать это программное обеспечение с тегами: MS Lync : {"Collaboration", "Communication"}, Аналогично для инструмента Informatica Я бы, вероятно, отметил это как: Informatica : {"IBM", "ETL", "Data Warehousing"} и так далее. Как я уже упоминал, в списке содержится большое количество различных программ, и о многих из них я не знаю, для чего мне приходится делать этот процесс вручную, что (не говоря уже о том) очень болезненно и отнимает много времени.

Подводя итог, для данного названия программного продукта:-

  1. искать в Интернете
  2. просканировать содержимое каждого из возвращенных URL-адресов (возможно, будет достаточно только первых 10 возвращенных URL-адресов)
  3. Определите теги для программного обеспечения по URL

Есть ли способ автоматизировать это с Python, который бы достиг того же?

0 ответов

Другие вопросы по тегам