NoneRvest - это пакет R, который предоставляет функции, помогающие извлекать информацию с веб-страниц.
0 ответов

R: сбор данных с ошибкой rvest - из-за "вложенных" форм?

Для извлечения контента с помощью "R" существует новый пакет "rvest" от Hadley Wickam. Он отлично работает для простых сессий, например, получение расписания для железнодорожного сообщения. Но когда я пытаюсь использовать расширенный поиск, он не ра…
02 дек '14 в 14:23
1 ответ

Очистка сайта для правительственной информации с R

Я работаю над канадским федеральным сайтом для исследовательского проекта по онлайн-петициям. Это весь сайт: http://www.oag-bvg.gc.ca/internet/English/pet_lp_e_940.html Мне нужно получить эти данные для каждой петиции: гиперссылка на петицию, номер …
19 май '15 в 02:39
1 ответ

Распечатать / показать файл JPG в R

При использовании rvest пакет Я пытаюсь напечатать / показать плакат lego_movie в R. Я не могу этого сделать. Вот мои попытки: library(rvest) poster <- lego_movie %>% html_nodes("#img_primary img") %>% html_attr("src") ## 1st attempt librar…
30 янв '15 в 01:46
0 ответов

Как я могу найти атрибуты в RSelenium

Я хотел бы найти все "ссылки" определенной веб-страницы, есть примеры, как это сделать в XML, rvest или splashr, я хотел бы сделать это с помощью Rselenium и Not, сначала найдя элементы, а затем getElementAttribute(..., "href"). Я ищу что-то похожее…
19 сен '17 в 17:32
1 ответ

R - отправка поискового запроса на сайт

У меня есть небольшая проблема, связанная с размещением поискового запроса на веб-сайте и отображением результата с помощью пакетов R rvest и httr... Я просто хочу запустить один поиск по имени "Acer campestre" и поставить галочку только в поле "Соо…
16 мар '18 в 18:49
0 ответов

rvest: html_text останавливается при обнаружении <-

Кажется, это тот случай, когда html_text перестает читать, когда встречает <- на веб-странице. Это правда, и если да, есть ли способ обойти это? library(rvest) library(dplyr) url &lt;- "http://www.qwizx.com/tpirepguide/?paged=2404#.WkUKjd_iY2z" epis…
28 дек '17 в 15:22
1 ответ

Преобразовать очищенные выходные данные в таблицу

Как я должен получить очищенный текст в таблицу с колонками library(rvest) base_url &lt;- c("https://www.sec.gov/Archives/edgar/data/1409916/000162828017002570/exhibit211nobilishealthcor.htm", "https://www.sec.gov/Archives/edgar/data/1320695/0001564…
22 фев '18 в 11:42
1 ответ

Очистка данных iframe в R

Я пытаюсь очистить веб-страницу, используя r, но проблема в том, что очищенный HTML-файл содержит только ссылку тега iframe ( http://mpe.motorolasolutions.com/?loc=US-EN&dest;=Channel&_ga=1.41985443.782208401.1466659393). Есть ли способ получить дан…
28 июн '16 в 06:39
0 ответов

Как очистить разные значения одним и тем же классом в R

Я хотел бы почистить некоторые данные с сайта. Однако с помощью гаджета-селектора они оба получили один и тот же класс CSS. Я также проверил код, и единственное отличие, похоже, заключается в значении класса labelOverSchool. Мой вопрос заключается в…
16 авг '18 в 09:38
1 ответ

Читать HTTPS URL в R как linkedin

Я пытаюсь прочитать страницу компании LinkedIn, например, https://www.linkedin.com/company/facebook получение названия компании, местоположения, типа отрасли и т. д. Это мой код ниже urlCreate1&lt;-"https://www.linkedin.com/company/facebook" parse_r…
09 мар '17 в 16:21
3 ответа

Создание кадра данных из очищенного вектора символов

Я пытаюсь создать фрейм данных со столбцами: имя, фамилия, сторона, штат, идентификатор участника. Вот мой код library('rvest') candidate_url &lt;- 'https://www.congress.gov/help/field-values/member-bioguide-ids' candidate_page &lt;- read_html(candi…
04 июл '17 в 17:36
1 ответ

Как получить доступ к странице, очищенной с помощью RSelenium с помощью rvest?

Я пытаюсь почистить веб-страницу, которая использует angular.js. Насколько я понимаю, единственный вариант в R - это использовать RSelenium для загрузки страницы, а затем анализировать содержимое. Тем не менее, я нахожу rvest более интуитивно поняте…
03 сен '17 в 00:44
0 ответов

rvest и чтение HTML-файлов из локального каталога

У меня есть много файлов HTML, хранящихся в локальном каталоге. В идеале я хотел бы использовать rvest для извлечения узлов таблицы, создания некоторого представления о фрейме данных и экспорта файлов в виде файлов.txt. Я не уверен, как правильно им…
17 май '18 в 20:17
1 ответ

Манипулировать строками из данных, извлеченных из Интернета

Я пытаюсь очистить данные с веб-страницы, и у меня возникают проблемы при работе со строками. Если вы посетите страницу, вы поймете, что это веб-сайт, написанный на французском языке. Я пытаюсь получить данные в табличном формате внизу страницы. На …
13 ноя '15 в 04:54
2 ответа

Веб-просмотр таблиц, созданных с использованием JavaScript

Я пытаюсь очистить таблицу на вкладке "Коды" на этом сайте (большая таблица, содержащая x а также .) Я думал, что одно из следующего сделает трюк... library(rvest) library(tidyverse) "https://international.ipums.org/international-action/variables/MI…
16 окт '17 в 04:57
1 ответ

Извлечение значений <tr> из нескольких файлов HTML

Я новичок в веб-слом. У меня более 3000 файлов html/htm, и мне нужно извлечь из них значения "tr" и преобразовать их в массив данных, чтобы провести дальнейший анализ. Коды, которые я использовал, это: html &lt;- list.files(pattern="\\.(htm|html)$")…
02 авг '17 в 11:58
2 ответа

Записи, не добавляемые в Dataframe в R

У меня есть датафрейм uuu_df с записями в виде ссылок сайта dim(uuu_df) output 1950 1 uuu_df 1) http://www.magicbricks.com/property-for-sale/residential-real-estate?bedroom=1&amp;proptype=Multistorey-Apartment,Builder-Floor-Apartment,Penthouse,Studi…
15 июн '17 в 13:26
1 ответ

Сохранение нескольких источников HTML в R

Я создал следующий код library('XML') library('rvest') links &lt;- c('https://www.google.com/', 'https://www.youtube.com/?gl=US', 'https://news.google.com/news/u/0/headlines?hl=en&amp;ned=us') for (i in 1:3){ html_object &lt;- read_html(links[i]) wr…
14 авг '17 в 17:46
2 ответа

Как передать несколько значений в форму представления rvest

Это продолжение предыдущей темы. Код работает фантастически для одного значения, но я получаю следующую ошибку при попытке передать более 1 значения, я получаю ошибку, основанную на длине функции. Ошибка в vapply(элементы, кодирование, символ (1)): …
15 окт '17 в 19:22
0 ответов

Как получить конкретную HTML-таблицу с веб-страницы в R?

Веселого Рождества stackru команда и читатели! я использую Rstudio и я с трудом пытаюсь получить html table с веб-страницы. Веб-страница находится здесь, и таблица, которую я хочу получить, имеет следующий XPath: //*[@id="h2hMatches"] Вот что я попр…
25 дек '17 в 10:45