Описание тега cheerio

Вопросы о Cheerio, реализации ядра jQuery, разработанного специально для сервера.
1 ответ

Соскребаешь ссылки с сайта, используя Node.js, request и cheerio?

Я пытаюсь почистить ссылки на веб-сайте расписания моей школы, используя Node.js, request и cheerio. Однако мой код не достигает всех тематических ссылок. Ссылка на сайт расписания курсов здесь. Ниже мой код: var express = require('express'); var re…
09 фев '16 в 23:32
1 ответ

Cheerio не может найти IMG SRC

Мой черио-код, похоже, не работает. Я пытаюсь получить СРК от <img> тег найден внутри imgWrap div по указанной ссылке. Я пытался переписать .imgWrap как .imgWrap img и удаление find но это тоже не сработало... Тем не менее, если я делаю $(elem…
23 дек '17 в 21:42
1 ответ

Данные из одного асинхронного выполнения функции смешиваются с другим выполнением функции

Я писал API веб-скрепинга, построенный на основе NodeJS, используя Cheerio, node-fetch и fs-extra. В следующем фрагменте кода я вызываю метод getReport для каждой строки в массиве config.supportedMountains. Для каждого из элементов я хочу запустить …
1 ответ

Webscraping с cheerio: удаление или игнорирование дочернего элемента?

Итак, у меня есть веб-сайт, который я хочу очистить, структурированный следующим образом: <p><strong>some headline:</strong> some content etc. blabla </p> <p><strong>some other headline:</strong> some more c…
18 дек '16 в 12:19
1 ответ

Как поместить очищающий контент в html (Node.js, cheerio)

Мне нужно списать некоторый контент и добавить его в мой HTML-файл. var request = require('request'); var cheerio = require('cheerio'); setInterval(function () { request('https://2ch.hk/rf/res/1490589.html', function (error, response, html) { if (!e…
16 ноя '14 в 23:35
0 ответов

Запрос NPM: Использование формы входа и сохранение файла cookie для последующего использования.

Так что это звучит просто, но документация не полностью объясняет, как именно. Попытка сканировать страницу, требующую входа пользователя, чтобы получить необходимую информацию. Я в порядке с основными запросами, используя запрос или запрос обещания…
28 ноя '18 в 13:48
2 ответа

Как передать изображение из запроса в pdfkit в node.js?

Во-первых, я новичок и в Javascript, и в Node.js, так что извините, если мой вопрос глупый. Я пытаюсь соскрести текст и изображения с веб-сайта и экспортировать их в PDF-файл, используя request, cheerio и pdfkit, но у меня проблемы. Я могу очистить …
18 фев '15 в 13:52
1 ответ

Любой способ получить близлежащие узлы HTML отличается от имени тега текущего узла в NodeJS?

Допустим, у меня есть следующий HTML-код.. <html> <head></head> <body> <div> <input type ="text"> <img src = "pic.jpg"> <a href ="index.html">Home</a> </div> </body> </html> И я…
23 июл '15 в 22:36
1 ответ

Web Scraping для извлечения опций из MCQ

Я пытаюсь отменить http://www.geekmcq.com/verbal-ability/analogies/ чтобы извлечь варианты из MCQ. Я делаю это для того, чтобы распечатать вопросы, которые не подходят для печати на веб-сайте. Я извлек вопрос и ответы, используя nodejs с плагином ст…
27 май '16 в 22:11
0 ответов

Node.js Вход на внешний сайт из кода. (осмос, привет)

Я пишу электронное приложение, которое связывается с внешним сайтом. и я узнал, что Cheerio не может очистить сайты, которые должны быть зарегистрированы. поэтому я использую осмос сейчас, но он показывает следующую ошибку. (get) loaded [get] https:…
2 ответа

Как извлечь жирный текст из тега <b> с помощью jQuery

У меня есть некоторый (плохой) HTML, который я пытаюсь очистить, который выглядит так &lt;div class="MsoNormal" style="text-align: justify;"&gt; &lt;span style="font-family: Georgia,&amp;quot;Times New Roman&amp;quot;,serif;"&gt; &lt;span style="col…
12 окт '14 в 18:16
1 ответ

Jest + энзим: TypeError: Невозможно прочитать свойство 'htmlparser2' неопределенного

Я использую шутку и энзим для создания этого теста, но у меня возникает эта ошибка при его создании. Это тест import React from 'react'; import { shallow, render } from 'enzyme'; import Title from './../'; describe('Title', () =&gt; { it('should ren…
22 ноя '17 в 14:39
1 ответ

Селекторы jquery / cheerio: как получить текст в теге b?

&lt;div class="class1"&gt; &lt;div class="item-class1"&gt; &lt;a href="http://www.example.com/1" target="blank" title="title1"&gt; &lt;b&gt;Test1&lt;/b&gt; &lt;/a&gt; &lt;/div&gt; &lt;/div&gt; Я пытался извлечь ссылки с этим кодом: var list = []; $(…
11 мар '18 в 12:32
1 ответ

Как получить имя элемента в cheerio с помощью node.js

Как получить имя элемента в cheerio? Эквивалент JQuery будет .attr('name') но это возвращает undefined в приветствии.
08 апр '14 в 12:42
0 ответов

У меня есть проблема в моем коде JavaScript, но я не могу знать, откуда она

Итак, здесь я кодирую (или, скорее, пытаюсь) очень простой маленький скрипт: это список с двумя переменными на элемент (nickname а также status), с функцией для создания нового элемента и добавления его в список, для удаления одного элемента и, нако…
27 янв '19 в 23:37
1 ответ

Chrome показывает другой HTML, чем мое приложение RequestJS & CheerioJS

Мое приложение-скребок выполняет поиск URL-адреса Vimeo с прикрепленной к нему строкой запроса, которая 'http://vimeo.com/search?q=angularjs' Когда я загружаю этот URL в Chrome, я вижу несколько элементов, которые не отображаются с request() этот UR…
28 сен '13 в 23:30
1 ответ

Соскоб температуры и влажности с Cheerio

Я пытался очистить следующую веб-страницу с помощью cheerio, чтобы получить последние данные о температуре и влажности для небольшого моего проекта: ссылка на веб-сайт К сожалению, мне кажется, что мне приходится копаться во многих тегах, и я не мог…
02 июл '14 в 11:58
2 ответа

Утечки памяти при очистке веб-страниц

Я пытаюсь проиндексировать все фильмы, сериалы... На этой веб-странице: http://newpct1.com/. Для каждого медиа контента я хочу сохранить его заголовок, URL торрент файла и размер файла. Для этого я использую NodeJS с модулями cheerio (извлекаем конт…
09 авг '17 в 16:33
2 ответа

Как выбрать <dei: DocumentType из XBRL с помощью Cheerio (или

Я пытаюсь получить текст (в данном случае это "10-Q") записи из XBRL, используя cheerio.js с nodejs. Строка ниже: &lt;dei:DocumentType contextRef="D2013Q3YTD" id="Fact-DB2A50C2A485F9CC21D51934C6E61D42"&gt;10-Q&lt;/dei:DocumentType&gt; Я пробовал: $(…
22 дек '13 в 17:13
1 ответ

Как получить все названия заголовков, полученные cheerio?

У меня есть следующий код, который предназначен для вывода всех имен заголовков, полученных Cheerio с определенной HTML-страницы. const cheerio = require('cheerio'); const rp = require('request-promise'); async function run() { const options = { uri…
05 авг '18 в 09:59