Google Safe Browsing API-кодировка URL (канонизация)

В моем приложении я проверяю введенные пользователем URL-адреса на наличие вредоносных программ, отправляя их в Google.

Чтобы проверить реакцию на "обнаружение вредоносного ПО", я использовал URL http://malware.testing.google.test/testing/malware

К моему удивлению, этот URL не был помечен как вредоносный

Обдумывая, я обнаружил, что когда я вхожу в косую черту, он воспринимается как вредоносное ПО.

В документации сказано, что URL нужно канонизировать.

Кто-нибудь из вас знает о выполнении этого требования? (желательно в C#)

2 ответа

Решение

Используя ссылку ForguesR при условии, я создал эту реализацию C#.

Он проходит 26 из 33 тестов из набора тестов Google, найденного по адресу: https://developers.google.com/safe-browsing/developers_guide_v3

Он был признан достаточно хорошим для производства, так как не улавливает более заметные веб-страницы.

Код: https://dotnetfiddle.net/xO9sWl

Я сейчас работаю над той же проблемой, и единственное, что я нашел, - это реализация Java в библиотеке jGoogleSafeBrowsing. К сожалению, он привязан к v2 API.

В любом случае, вы можете взглянуть на код канонизации здесь. Быть в курсе, что:

Другие вопросы по тегам