Свободно доступные реальные общедоступные данные

Примечание: я не ищу пример данных.

Какие наборы реальных данных предоставляются для свободного доступа в разных доменах:

Например:

  1. Финансовые отчеты для FCM. http://www.cftc.gov/MarketReports/FinancialDataforFCMs/HistoricalFCMReports/index.htm

  2. Данные YouTube: (показатели популярности и статистика каналов) https://developers.google.com/youtube/analytics/

Пожалуйста, поделитесь, если больше таких данных доступны.

Может быть связано с ниже или что-нибудь еще, что может быть полезно.

Может быть в области медицины, фармации, медицины.

Трафик, аварии, несчастные случаи в разных городах, на дорогах и т. Д.

Метрики безопасности женщин в разных населенных пунктах.

Продукты питания / напитки Потребление, цена.

Количество мусора, уборные в зависимости от местности / кв.

Сколько приютов и сколько средств они получили.

Сколько парковки для инвалидов доступно в городе и т. Д.

Я был бы очень признателен, если бы предложил мне лучший форум, если вы считаете, что этот вопрос не подходит для этого типа платформы.

2 ответа

Решение

Да, это правильный форум, есть много мест, где наборы данных доступны бесплатно, я собрал по ссылкам за периоды, многие из них для целей обучения, мало для действительно серьезных для решения проблем.

У UCI есть знаменитое хранилище данных на http://archive.ics.uci.edu/ml/

Очень хорошие данные о погоде на http://www.knmi.nl/climatology/daily_data/download.html

Набор данных для различного порядка задач ML с точки зрения сложности http://college.cengage.com/mathematics/brase/understandable_statistics/7e/students/datasets/slr/frames/frame.html

Если у вас есть учетная запись Wolfarm Alpha pro, вы можете загрузить данные исследований в формате CSV. Например (Наведите указатель мыши на графики, чтобы получить ссылку для загрузки) http://www.wolframalpha.com/input/?i=home+prices+folsom+california http://www.wolframalpha.com/input/?i=historical+gold+prices

Как упоминалось ранее, прошедшие и текущие соревнования являются отличными исходными наборами данных для экспериментов и проверки точности алгоритмов. https://www.kaggle.com/competitions

На http://fimi.ua.ac.be/data/ имеется множество наборов данных, в том числе о розничном рынке и трафике.

Архив данных UCI по адресу http://kdd.ics.uci.edu/

Архив данных Statlib http://lib.stat.cmu.edu/datasets/

Наборы данных экономических временных рядов из Университета Мэриленда http://inforumweb.umd.edu/econdata/econdata.html

Здесь есть много временных рядов, охватывающих различные библиотеки данных аспекта, скомпилированные для Университета Монаш, Австралия (интересные наборы данных о займах, поголовье овец и т. Д.) http://datamarket.com/data/list/?q=provider:tsdl

Данные считаются товаром, и лишь немногие сайты продают данные для исследователей. http://datamarket.com/

Различные наборы данных для общего пользования могут быть найдены здесь, http://www.cs.ucr.edu/~eamonn/time_series_data/

Сбор списка пространственных данных на http://geodacenter.asu.edu/datalist/

Некоторые интересные наборы данных для обучения http://calcnet.mth.cmich.edu/org/spss/Prjs_DataSets.htm

Набор данных исследования британских выборов http://www.britishelectionstudy.com/data/

Данные социального опроса в Германии http://www.gesis.org/en/allbus/allbus-home/

Наборы данных исследований из Гарварда http://www.cid.harvard.edu/ciddata/ciddata.html

Различные наборы данных, скомпилированные по международной экономике, которые могут требовать некоторого массива данных, как многие наборы данных, найденные здесь http://graduateinstitute.ch/home/study/academicdepartments/international-economics/md4stata/datasets.html

Сообщество Stackru данных в огромном файле можно найти здесь для любого исследования данных http://blog.stackru.com/category/cc-wiki-dump/

Бесплатные экономические, демографические и финансовые данные (требуется авторизация) https://www.economy.com/freelunch/

Сайт правительства США, посвященный данным https://www.data.gov/

Amazon размещает огромные общедоступные наборы данных на AWS https://aws.amazon.com/datasets?_encoding=UTF8&jiveRedirect=1

Коллекция многих наборов данных, собранных по адресу http://www.kdnuggets.com/2011/02/free-public-datasets.html http://www.datasciencecentral.com/profiles/blogs/big-data-sets-available-for-free http://www.infochimps.com/datasets http://www.quora.com/Where-can-I-find-large-datasets-open-to-the-public

Источник данных XML http://usgovxml.com/

Извините за длинные и неимоверные ссылки на наборы данных:)

Вот некоторые из верхней части моей головы.

В веб-сервисах Amazon доступны общедоступные наборы данных:

https://aws.amazon.com/datasets

Socrata - стартап-программная платформа для городов для публикации своих данных:

https://opendata.socrata.com/

Среди городов, которые используют Сократу, - Сан-Франциско и Нью-Йорк:

https://data.sfgov.org/

https://nycopendata.socrata.com/

Наборы данных UC Irvine (очень маленькие данные):

http://archive.ics.uci.edu/ml/

Соревнования Kaggle по применению машинного обучения к реальным (но анонимным) данным:

https://www.kaggle.com/competitions

KDNuggets сборник известных наборов данных:

http://www.kdnuggets.com/datasets/index.html

Другие вопросы по тегам