Автоматизировать классификацию программного обеспечения с помощью Python
Можно ли построить программу для привязки "тегов" к определенному программному обеспечению? У меня есть список >1000
названия программ, которые необходимо классифицировать с помощью связанных тегов. Например, для программного обеспечения "MS Lync"
Сначала я должен выполнить поиск в Интернете (Google) и просмотреть содержимое каждого возвращенного URL-адреса, чтобы понять его назначение, и, наконец, связать это программное обеспечение с тегами: MS Lync : {"Collaboration", "Communication"}
, Аналогично для инструмента Informatica
Я бы, вероятно, отметил это как: Informatica : {"IBM", "ETL", "Data Warehousing"}
и так далее. Как я уже упоминал, в списке содержится большое количество различных программ, и о многих из них я не знаю, для чего мне приходится делать этот процесс вручную, что (не говоря уже о том) очень болезненно и отнимает много времени.
Подводя итог, для данного названия программного продукта:-
- искать в Интернете
- просканировать содержимое каждого из возвращенных URL-адресов (возможно, будет достаточно только первых 10 возвращенных URL-адресов)
- Определите теги для программного обеспечения по URL
Есть ли способ автоматизировать это с Python, который бы достиг того же?