Свободно доступные реальные общедоступные данные
Примечание: я не ищу пример данных.
Какие наборы реальных данных предоставляются для свободного доступа в разных доменах:
Например:
Финансовые отчеты для FCM. http://www.cftc.gov/MarketReports/FinancialDataforFCMs/HistoricalFCMReports/index.htm
Данные YouTube: (показатели популярности и статистика каналов) https://developers.google.com/youtube/analytics/
Пожалуйста, поделитесь, если больше таких данных доступны.
Может быть связано с ниже или что-нибудь еще, что может быть полезно.
Может быть в области медицины, фармации, медицины.
Трафик, аварии, несчастные случаи в разных городах, на дорогах и т. Д.
Метрики безопасности женщин в разных населенных пунктах.
Продукты питания / напитки Потребление, цена.
Количество мусора, уборные в зависимости от местности / кв.
Сколько приютов и сколько средств они получили.
Сколько парковки для инвалидов доступно в городе и т. Д.
Я был бы очень признателен, если бы предложил мне лучший форум, если вы считаете, что этот вопрос не подходит для этого типа платформы.
2 ответа
Да, это правильный форум, есть много мест, где наборы данных доступны бесплатно, я собрал по ссылкам за периоды, многие из них для целей обучения, мало для действительно серьезных для решения проблем.
У UCI есть знаменитое хранилище данных на http://archive.ics.uci.edu/ml/
Очень хорошие данные о погоде на http://www.knmi.nl/climatology/daily_data/download.html
Набор данных для различного порядка задач ML с точки зрения сложности http://college.cengage.com/mathematics/brase/understandable_statistics/7e/students/datasets/slr/frames/frame.html
Если у вас есть учетная запись Wolfarm Alpha pro, вы можете загрузить данные исследований в формате CSV. Например (Наведите указатель мыши на графики, чтобы получить ссылку для загрузки) http://www.wolframalpha.com/input/?i=home+prices+folsom+california http://www.wolframalpha.com/input/?i=historical+gold+prices
Как упоминалось ранее, прошедшие и текущие соревнования являются отличными исходными наборами данных для экспериментов и проверки точности алгоритмов. https://www.kaggle.com/competitions
На http://fimi.ua.ac.be/data/ имеется множество наборов данных, в том числе о розничном рынке и трафике.
Архив данных UCI по адресу http://kdd.ics.uci.edu/
Архив данных Statlib http://lib.stat.cmu.edu/datasets/
Наборы данных экономических временных рядов из Университета Мэриленда http://inforumweb.umd.edu/econdata/econdata.html
Здесь есть много временных рядов, охватывающих различные библиотеки данных аспекта, скомпилированные для Университета Монаш, Австралия (интересные наборы данных о займах, поголовье овец и т. Д.) http://datamarket.com/data/list/?q=provider:tsdl
Данные считаются товаром, и лишь немногие сайты продают данные для исследователей. http://datamarket.com/
Различные наборы данных для общего пользования могут быть найдены здесь, http://www.cs.ucr.edu/~eamonn/time_series_data/
Сбор списка пространственных данных на http://geodacenter.asu.edu/datalist/
Некоторые интересные наборы данных для обучения http://calcnet.mth.cmich.edu/org/spss/Prjs_DataSets.htm
Набор данных исследования британских выборов http://www.britishelectionstudy.com/data/
Данные социального опроса в Германии http://www.gesis.org/en/allbus/allbus-home/
Наборы данных исследований из Гарварда http://www.cid.harvard.edu/ciddata/ciddata.html
Различные наборы данных, скомпилированные по международной экономике, которые могут требовать некоторого массива данных, как многие наборы данных, найденные здесь http://graduateinstitute.ch/home/study/academicdepartments/international-economics/md4stata/datasets.html
Сообщество Stackru данных в огромном файле можно найти здесь для любого исследования данных http://blog.stackru.com/category/cc-wiki-dump/
Бесплатные экономические, демографические и финансовые данные (требуется авторизация) https://www.economy.com/freelunch/
Сайт правительства США, посвященный данным https://www.data.gov/
Amazon размещает огромные общедоступные наборы данных на AWS https://aws.amazon.com/datasets?_encoding=UTF8&jiveRedirect=1
Коллекция многих наборов данных, собранных по адресу http://www.kdnuggets.com/2011/02/free-public-datasets.html http://www.datasciencecentral.com/profiles/blogs/big-data-sets-available-for-free http://www.infochimps.com/datasets http://www.quora.com/Where-can-I-find-large-datasets-open-to-the-public
Источник данных XML http://usgovxml.com/
Извините за длинные и неимоверные ссылки на наборы данных:)
Вот некоторые из верхней части моей головы.
В веб-сервисах Amazon доступны общедоступные наборы данных:
https://aws.amazon.com/datasets
Socrata - стартап-программная платформа для городов для публикации своих данных:
Среди городов, которые используют Сократу, - Сан-Франциско и Нью-Йорк:
https://nycopendata.socrata.com/
Наборы данных UC Irvine (очень маленькие данные):
http://archive.ics.uci.edu/ml/
Соревнования Kaggle по применению машинного обучения к реальным (но анонимным) данным:
https://www.kaggle.com/competitions
KDNuggets сборник известных наборов данных: