Google Safe Browsing API-кодировка URL (канонизация)
В моем приложении я проверяю введенные пользователем URL-адреса на наличие вредоносных программ, отправляя их в Google.
Чтобы проверить реакцию на "обнаружение вредоносного ПО", я использовал URL http://malware.testing.google.test/testing/malware
К моему удивлению, этот URL не был помечен как вредоносный
Обдумывая, я обнаружил, что когда я вхожу в косую черту, он воспринимается как вредоносное ПО.
В документации сказано, что URL нужно канонизировать.
Кто-нибудь из вас знает о выполнении этого требования? (желательно в C#)
2 ответа
Используя ссылку ForguesR при условии, я создал эту реализацию C#.
Он проходит 26 из 33 тестов из набора тестов Google, найденного по адресу: https://developers.google.com/safe-browsing/developers_guide_v3
Он был признан достаточно хорошим для производства, так как не улавливает более заметные веб-страницы.
Я сейчас работаю над той же проблемой, и единственное, что я нашел, - это реализация Java в библиотеке jGoogleSafeBrowsing. К сожалению, он привязан к v2 API.
В любом случае, вы можете взглянуть на код канонизации здесь. Быть в курсе, что:
- этот код выпущен как открытый исходный код под лицензией Creative Commons NC-SA;
- этот код может не пройти тестовый набор Google для канонизации.