Организация реляционной базы данных научных статей

Question

Организация реляционной базы данных научных статей

Мне нужна помощь в организации реляционной базы данных, которая у меня сейчас есть на авиабазе (но она может существовать в любой реляционной базе данных или электронной таблице). В данный момент я просто пытаюсь найти решение для одной записи (строки). ниже приведена ссылка на расписание, а также объяснение проблемы, которую я надеюсь решить.

Цель базы данных - оценить потенциальное влияние исследований через продукт.

Например, в таблице ниже, у нас есть список каждой исследовательской статьи о дезинформации и поддельные новости, а затем еще одна таблица с гипотетическими продуктами, основанными на исследовании.

В одной строке идентификатора, например справки, есть гипотетический продукт, который будет помечать поддельные новостные статьи на Facebook. Это ссылка на несколько научных статей, оценивающих потенциальное воздействие. У нас есть статьи, в которых измеряется количество поддельных новостей, созданных Facebook, эффект от просмотра тега, предупреждающего пользователей о поддельных новостях, и процент поддельных новостей, которые в настоящее время могут идентифицировать алгоритмы.

Таким образом, в идеальной ситуации каждый из этих размеров эффекта умножается один на другой. Грубо говоря, 20% всех поддельных новостей генерируется на Facebook, алгоритмы могут правильно пометить 80%, а просмотр тега уменьшает потребление поддельных новостей на 10%, тогда функция тегирования снизит потребление всех поддельных новостей на 1,6%.

Вопрос в том, как организовать столбцы, учитывая, что для каждой статьи так много возможных переменных. Каждая платформа, эффект и популяция - это отдельная переменная... это быстро становится довольно большим.

В таблице ниже я сделал очень примитивную версию. Таблица ключей - "продукт". Он ссылается на отдельную таблицу, которая называется "исследование", и таблица исследований имеет несколько размеров эффекта, например, в одной статье о поддельных новостях есть колонка о том, как пометки сокращают потребление поддельных новостей. это один столбец прямо сейчас под "размером эффекта", а другой столбец, который определяет размер эффекта для тегирования. Это исследование связано с таблицей под названием "стратегия", где "тегирование новостей" имеет оценку воздействия, а затем "таблица продуктов", которая ссылается на стратегию тегирования и объединяет ее с оценкой поддельных новостей на Facebook, умножает два и дает потенциальное влияние.

В таблице товаров "пометка поддельных новостей" это собственный столбец. Но, если это будет продолжаться, каждая строка будет иметь тысячи столбцов для каждой возможной стратегии и исследовательской цитаты.

https://airtable.com/shrZFTrdIe4TshEHs

Должен быть лучший способ организовать это. Это слишком громоздко сейчас.

Я надеюсь, что этот вопрос был несколько ясен, и не стесняйтесь, дайте мне знать, как я могу облегчить ответ на вопрос. благодарю вас

0

database spreadsheet airtable

Источник

user3368667 09 июн '18 в 18:23

0 ответов

Другие вопросы по тегам database spreadsheet airtable