Описание тега google-refine

OpenRefine (ранее Google Refine) - это бесплатный инструмент для очистки данных с открытым исходным кодом.
1 ответ

Как сохранить только определенные элементы JSON в новом столбце OpenRefine

{ "business_id": "SQ0j7bgSTazkVQlF5AnqyQ", "full_address": "214 E Main St\nCarnegie\nCarnegie, PA 15106", "hours": {}, "open": true, ** "categories": ["Chinese", "Restaurants"] ** , "city": "Carnegie", "review_count": 9, "name": "Don Don Chinese Res…
21 апр '16 в 20:53
1 ответ

Разбор JSON в Google Refine

Я пытаюсь извлечь конкретные элементы из результатов из API-интерфейса координат 2 политик данных, используя Google Refine. Вот пример ячейки № 1: [{"politics":[ {"type":"admin2","friendly_type":"country","code":"usa","name":"United States"}, {"type…
24 апр '12 в 18:53
1 ответ

Как изменить значения в фасете на одно и то же в Google Refine?

Я пытаюсь очистить эти данные: https://dl.dropbox.com/u/820037/local_council_election_data_w_occupation.gz Это все кандидаты на выборы в местные советы в Финляндии. В графе "Амматти" указана профессия кандидата. Я хочу найти всех студентов, но пробл…
09 окт '12 в 08:01
3 ответа

Объединить все данные во втором столбце для каждого уникального значения в первом столбце

У меня есть два столбца данных. Некоторые данные в первом столбце повторяются (они представляют вопросы). Данные во втором столбце уникальны (они представляют собой несколько ответов на один и тот же вопрос). Мне нужно объединить все данные во второ…
11 июл '14 в 22:08
1 ответ

Google уточняет и выбирает данные из freebase для большого набора данных, чтобы создать столбец из URL-адреса не работает

У меня есть проект уточнения Google с 36k строк данных. Я хотел бы добавить еще один столбец с извлечением данных JSON из URL-адреса freebase. Мне удалось заставить его работать с небольшим набором данных, но когда я запустил его в этом проекте, пот…
06 мар '12 в 01:55
1 ответ

Получение значения по номеру строки и номера столбца

В пользовательском текстовом фасете я хочу проверить значение ячейки предыдущей строки. Я старался rows[row.index - 1] без результата.
06 апр '12 в 13:31
1 ответ

Google Refine Reconciliation: как автоматически заменить текст результата

Допустим, у меня есть такая клетка: "Nat. Taiwan Normal Univ., Taipei" Как только я делаю примирение, я получаю это: Nat. Taiwan Normal Univ., Taipei V V Создать новую тему Поиск совпадения Затем я нажимаю "Поиск соответствия" и получаю выпадающий с…
21 авг '12 в 15:19
2 ответа

Могу ли я вызывать внешние функции *python* из Google Уточнить?

Я изучаю доработку Google, чтобы ускорить некоторые мои работы с данными - никогда не использовал их до этой недели, но мне нравится многое из того, что я вижу. Мой самый большой вопрос до сих пор заключается в том, можно ли вызывать внешние функции…
02 фев '12 в 17:54
1 ответ

Как объединить столбцы с пустыми пробелами в Google

Я работаю с базой данных в Google уточнения и у меня есть 2 столбца с информацией "год". В обоих столбцах есть значения и пробелы, а там, где у одного есть значение, у другого есть пустое пространство, поэтому я хочу объединить оба. Я нашел этот уче…
22 окт '15 в 11:36
0 ответов

Open Refine: открытый выпуск проекта

Я пользователь Open Refine. Я использую этот инструмент с расширением RDF. Я создал ряд проектов RDF. Каждый раз, когда я открываю этот инструмент, я нахожу мои существующие проекты под опцией Open Refine "Open Project". Два дня назад я обновил Java…
26 фев '16 в 07:15
1 ответ

Заполнить по записи в Google Refine

У меня есть следующий CSV-файл с разделителями-запятыми в Google уточнение: Как заполнить значения из column1, используя Jython или GREL, чтобы стать: Я пытался: if value is None: return row["record"]["cells"]["column1"]["value"][0] else: return val…
15 янв '13 в 15:00
1 ответ

Подключение к GoogleRefine с помощью программы Java

Этот вопрос аналогичен публикации "Автоматизация Google с использованием сценариев с помощью ruby ​​python perl java или другим способом": Автоматизация Google с использованием сценариев с использованием ruby ​​python perl java или другим способом У…
25 дек '15 в 23:00
1 ответ

Управляемая сценариями автоматизация Google уточняется с помощью ruby ​​python, perl, java или другим способом.

ФОН: Сотрудник Адам использовал Google уточнение для обработки загрузок базы данных с большим успехом в течение последнего года или около того, но Адам получил новое предложение о работе, и, следовательно, вся его работа и опыт, которые он сделал в …
22 дек '11 в 01:36
1 ответ

Прогрессивный номер в колонке Openrefine

Можно ли создать "счетчик", прогрессивное число в столбце, используя GREL? Например, я хотел бы добавить value на этот номер, чтобы сгенерировать идентификатор для каждой записи.
01 мар '16 в 13:42
1 ответ

Получение данных Freebase в Google Refine

Я довольно новичок в Google Refine и Frebase. Я хочу использовать список интернет / веб-сайтов, но дамп не содержит URL-адрес веб-сайта, однако он доступен в связанном объекте "официальный веб-сайт". В Refine, как можно получить эти данные на основе…
06 окт '12 в 18:08
2 ответа

Регулярное выражение для value.contains() в Google Refine

У меня есть столбец строк, и я хочу использовать регулярное выражение, чтобы найти запятые или каналы в каждой ячейке, а затем выполнить действие. Я пробовал это, но это не работает (нет синтаксической ошибки, просто не совпадает ни с запятыми, ни с…
23 фев '16 в 10:23
1 ответ

Google уточнение: используйте фасетные инструменты, чтобы вывести карту между двумя столбцами

Я искал, но не нашел, как это сделать в доработке. У меня есть две колонки уникальных IDS. Для каждого a в A я хочу найти лучшие 10 самых близких совпадений в B. Мой план резервного копирования состоит в том, чтобы просто использовать Левенштейна дл…
21 мар '13 в 16:43
1 ответ

OpenRefine: "Fill Up" заменяет значения вдоль одного столбца

У меня есть следующая таблица ╔════════╦════════╦════════╦════════╗ ║ record ║ Brand ║ Model ║ Spec ║ ╠════════╬════════╬════════╬════════╣ ║ 1 ║ X ║ null ║ 1 ║ ║ ║ X ║ DF ║ 3 ║ ║ ║ X ║ null ║ 5 ║ ║ 2 ║ Y ║ null ║ 1 ║ ║ ║ Y ║ AB ║ 3 ║ ║ ║ Y ║ null ║…
25 апр '18 в 16:27
1 ответ

Очистить неструктурированное название места в структурированный формат

У меня около 300 тыс. Неструктурированных данных, как показано на экране ниже. Я пытаюсь использовать Google уточнение или OpenRefine, чтобы исправить это. Тем не менее, я не могу найти правильный способ сделать это. Я новичок в этом инструменте. Лю…
26 мар '18 в 18:43
2 ответа

Добавить числа вниз по столбцу в OpenRefine

Я хотел бы автоматически нумеровать столбец. Как и в Excel, где я могу набрать "1" в одной ячейке, а ячейки под ней автоматически нумеруются как 2, 3, 4, 5 и т. Д. Я не знаю, почему у меня так много проблем с выяснением этой функции в Openrefine, но…
21 дек '16 в 15:57