Есть ли лучшая практика для получения превью ссылок?
По существу, учитывая любой URL-адрес, я мог получить веб-страницу в Ruby, используя
doc = Nokogiri::HTML(open(my_url))
title = doc.at('meta[property="og:title"]')['content']
...
и извлеките нужные мне элементы
Есть ли лучшие практики перед получением каких-либо ссылок? Это также похоже на потенциальную угрозу безопасности.
Я предполагаю, что большие компании, такие как facebook, могут пропустить изображение через какую-то модель, чтобы определить, следует ли его подвергать цензуре?
1 ответ
По существу, учитывая любой URL-адрес, я мог получить веб-страницу в Ruby, используя
Я использую метаинспектор для получения данных OG из различных URL-адресов мультимедиа. Он работает очень хорошо и может избавить вас от головной боли.
Есть ли лучшие практики перед получением каких-либо ссылок? Это также похоже на потенциальную угрозу безопасности.
Это зависит от вашего приложения, от того, какую информацию вы собираете и что вы показываете пользователю. Если вас беспокоят нецензурные слова, вы можете отфильтровать их (могут быть некоторые жемчужины), но обычно в мете OG я не видел ни одного из них. Вы можете занести в черный список домены веб-сайтов для взрослых или разрешить только некоторые домены ..
Я предполагаю, что большие компании, такие как facebook, могут пропустить изображение через какую-то модель, чтобы определить, следует ли его подвергать цензуре?
Распознавание изображений - это способ сделать это, но он требует большой работы. Много.