Есть ли лучшая практика для получения превью ссылок?

По существу, учитывая любой URL-адрес, я мог получить веб-страницу в Ruby, используя

      doc = Nokogiri::HTML(open(my_url))
title = doc.at('meta[property="og:title"]')['content']
...

и извлеките нужные мне элементы

Есть ли лучшие практики перед получением каких-либо ссылок? Это также похоже на потенциальную угрозу безопасности.

Я предполагаю, что большие компании, такие как facebook, могут пропустить изображение через какую-то модель, чтобы определить, следует ли его подвергать цензуре?

1 ответ

По существу, учитывая любой URL-адрес, я мог получить веб-страницу в Ruby, используя

Я использую метаинспектор для получения данных OG из различных URL-адресов мультимедиа. Он работает очень хорошо и может избавить вас от головной боли.

Есть ли лучшие практики перед получением каких-либо ссылок? Это также похоже на потенциальную угрозу безопасности.

Это зависит от вашего приложения, от того, какую информацию вы собираете и что вы показываете пользователю. Если вас беспокоят нецензурные слова, вы можете отфильтровать их (могут быть некоторые жемчужины), но обычно в мете OG я не видел ни одного из них. Вы можете занести в черный список домены веб-сайтов для взрослых или разрешить только некоторые домены ..

Я предполагаю, что большие компании, такие как facebook, могут пропустить изображение через какую-то модель, чтобы определить, следует ли его подвергать цензуре?

Распознавание изображений - это способ сделать это, но он требует большой работы. Много.

Другие вопросы по тегам