Описание тега dmoz
"Directory Mozilla", также известный как Open Directory Project (ODP).
3
ответа
Как получить URL-адреса из Dmoz ODP
Я хочу использовать базу данных URL-адресов, присутствующих в DMOZ ODP, для моего приложения. (массив строк URL или файл, содержащий то же самое). Есть ли какой-нибудь способ его получения (кроме копирования-вставки вручную)? РЕДАКТИРОВАТЬ: Есть ли …
24 дек '09 в 04:50
0
ответов
Преобразовать каталог dmoz в дерево карт разума
www.dmoz.org предоставляет полную веб-категорию в файле RDF здесь http://www.dmoz.org/rdf.html Я хотел бы создать карту разума (используя такие инструменты, как, например, свободный разум) или визуальное дерево, используя RDF-файл по ссылке выше. Ес…
29 ноя '13 в 00:11
1
ответ
Первый урок Scrapy dmoz, возвращающий ошибку en: "Ошибка типа: невозможно использовать реализатор с классами. Вместо этого используйте одну из функций объявления классов".
Получение ошибки при запуске первого урока для scrapy.Scrapy: 0,22,2lxml: 3.3.5.0libxml2: 2.7.8Витая: 12.0.0Python: 2.7.2 (по умолчанию, 11 октября 2012 г., 20:14:37) - [GCC 4.2.1 Совместимый Apple Clang 4.0 (теги /Apple/clang-418.0.60)]Платформа: D…
19 июн '14 в 20:09
2
ответа
Dmoz/Monster алгоритм для расчета количества каждой категории и подкатегории?
Я должен создать страницу просмотра, например, monter.com или каталог dmoz. Моя проблема заключается в подсчете для каждой категории. Как лучше всего делать подобное? Я использую PHP/MySQL Thx!
23 июн '10 в 09:20
0
ответов
DMOZ RDF дамп в MySQL или SQLite
Я скачал последний дамп rdf с dmoz.orgТеперь я хочу создать базу данных SQLite или MySQL (предпочтительно MySQL) в Python. Python по умолчанию не поддерживает MySQL, вам придется установить его с: sudo apt-get install python-mysqldb теперь дамп rdf …
23 май '13 в 11:13
0
ответов
Как мне конвертировать DMOZ ODP RDF в MySQL?
Я скачал структуру DMOZ ODP и архивы контента с http://rdf.dmoz.org/. Как я могу преобразовать их из RDF это MySQL? Проблема в том, что RDP-файлы ODP содержат ошибки, и их невозможно проанализировать с помощью строгого парсера. Я нашел dmoz2mysql, н…
29 окт '09 в 15:46
0
ответов
Как распаковать URL-адреса dmoz из дампа rdf с помощью python и rdflib?
Я пытался открыть файл rdf (dmoz rdf dump), но получил это сообщение об ошибке Traceback (most recent call last): File "/media/_dev_/ODP_RDF_get_links.py", line 4, in <module> result = g.parse("data/content.rdf") File "/usr/local/lib/python2.7…
06 апр '15 в 00:57
0
ответов
Какие есть активные открытые каталоги / репозитории веб-сайтов?
Я работаю над проектом с большими данными (использующим Python), и мне нужно использовать огромную коллекцию активных и законных веб-сайтов /URL-адресов (не менее 20 КБ). DMOZ сделал бы трюк, но он больше не доступен. Существуют ли другие активные к…
24 авг '18 в 11:58
1
ответ
Разбор dmoz rdf файлов с использованием php скрипта
Я использовал скрипт php в http://sourceforge.net/projects/dmoz2mysql/files/ загружать, извлекать, очищать, анализировать и вставлять данные dmoz в таблицу mysql. я не сталкиваюсь с проблемой при обработке struct.rdf. Но при разборе content.rdf возн…
08 мар '10 в 08:37
2
ответа
Учебное пособие по Scrapy: не удается запустить Scrap Crawl Dmoz
Я задаю новый вопрос, потому что я знаю, что я не был достаточно ясен в последнем. Я пытаюсь следовать учебному пособию по scrapy, но я застрял в решающем шаге, команде "scrapy crawl dmoz". Вот код (я написал это в оболочке python и сохранил, набрав…
14 авг '13 в 10:53
1
ответ
Получить описание (мета) сайта с ODP DMOZ.org используя PHP
Я работаю над сайтом php. Я хочу удалить описание или метаинформацию веб-сайтов. Я надеюсь получить информацию от dmoz.org, есть ли способ сделать это? Если нет, то каковы другие альтернативы? CURL? Большое спасибо, РЕДАКТИРОВАТЬ: Видимо мой вопрос …
21 сен '11 в 17:42
1
ответ
Как предотвратить отображение данных DMOZ в результатах поиска
Когда я просматриваю свой сайт в Google, на странице результатов все выглядит отлично, за исключением небольшого серого заголовка / описания рядом с моим доменным именем (снимок экрана ниже), который генерируется из DMOZ. Все остальные элементы гене…
19 окт '16 в 16:28
0
ответов
Не удалось загрузить файл JAR "Не удалось загрузить класс"
Я пытаюсь проанализировать файл DMOZ, используя этот код. Однако после запуска кода приложение останавливается в начале, выдавая следующие исключения: SLF4J: Failed to load class "org.slf4j.impl.StaticLoggerBinder". SLF4J: Defaulting to no-operation…
19 окт '15 в 05:20
11
ответов
Разбор огромных XML-файлов в PHP
Я пытаюсь проанализировать XML-файлы содержимого / структуры DMOZ в MySQL, но все существующие сценарии для этого очень старые и не работают должным образом. Как я могу открыть большой (+1GB) XML-файл в PHP для разбора?
26 май '09 в 16:50
0
ответов
Поведенческий анализ: объединение категорий DMOZ
Я пытаюсь проанализировать поведение пользователя, используя URL-адреса, которые посетил парень, и сделать точный прогноз о его популярных категориях DMOZ ( http://dmoztools.net/). Мы также создали API, который довольно точно отображает URL в катего…
12 сен '17 в 14:23
1
ответ
Как использовать данные RDF Dmoz с MySQL и PHP?
Я искал в Интернете, но все еще не смог получить надежный ответ. Моя цель - использовать данные rdf из dmoz, поэтому здесь есть 2 вопроса: Как импортировать RDF в MySQL? (любой твердый инструмент может быть использован?) как сделать данные запрашива…
09 янв '12 в 13:20
1
ответ
Исключение при разборе структуры.rdf.u8 с использованием Jena
Model model = ModelFactory.createDefaultModel(); InputStream in = FileManager.get().open( "W:\\structure.rdf.u8" ); model.read(in, null); model.write(System.out); Я использую приведенный выше код, предоставленный в документации Jena, для разбора OD…
06 авг '15 в 08:29
1
ответ
Разбор DMOZ-дампов для запросов категорий в Python
В настоящее время я работаю над проектом, который включает в себя поиск "областей знаний", с которыми связано определенное ключевое слово. Я планирую сделать это с помощью DMOZ. Например, "Брэд Питт" дает Arts: People: P: Pitt, Brad: Fan Pages (10) …
04 авг '13 в 15:16
2
ответа
Как обнаружить листинг сайта в каталоге DMOZ из PHP
Как я могу определить, есть ли конкретный сайт в каталоге DMOZ из PHP?
06 фев '12 в 15:12
2
ответа
Сканирование нескольких веб-страниц с веб-сайта
Я хочу извлечь данные с веб-сайта. Скажем, URL-адрес http://www.example.com/. Поэтому я поместил этот URL в start_urls (ссылаясь на пример DMOZ в документации). Но я также хочу создать графический интерфейс, когда я ввожу строку и нажимаю на кнопку,…
15 апр '12 в 07:23