Организация реляционной базы данных научных статей
Мне нужна помощь в организации реляционной базы данных, которая у меня сейчас есть на авиабазе (но она может существовать в любой реляционной базе данных или электронной таблице). В данный момент я просто пытаюсь найти решение для одной записи (строки). ниже приведена ссылка на расписание, а также объяснение проблемы, которую я надеюсь решить.
Цель базы данных - оценить потенциальное влияние исследований через продукт.
Например, в таблице ниже, у нас есть список каждой исследовательской статьи о дезинформации и поддельные новости, а затем еще одна таблица с гипотетическими продуктами, основанными на исследовании.
В одной строке идентификатора, например справки, есть гипотетический продукт, который будет помечать поддельные новостные статьи на Facebook. Это ссылка на несколько научных статей, оценивающих потенциальное воздействие. У нас есть статьи, в которых измеряется количество поддельных новостей, созданных Facebook, эффект от просмотра тега, предупреждающего пользователей о поддельных новостях, и процент поддельных новостей, которые в настоящее время могут идентифицировать алгоритмы.
Таким образом, в идеальной ситуации каждый из этих размеров эффекта умножается один на другой. Грубо говоря, 20% всех поддельных новостей генерируется на Facebook, алгоритмы могут правильно пометить 80%, а просмотр тега уменьшает потребление поддельных новостей на 10%, тогда функция тегирования снизит потребление всех поддельных новостей на 1,6%.
Вопрос в том, как организовать столбцы, учитывая, что для каждой статьи так много возможных переменных. Каждая платформа, эффект и популяция - это отдельная переменная... это быстро становится довольно большим.
В таблице ниже я сделал очень примитивную версию. Таблица ключей - "продукт". Он ссылается на отдельную таблицу, которая называется "исследование", и таблица исследований имеет несколько размеров эффекта, например, в одной статье о поддельных новостях есть колонка о том, как пометки сокращают потребление поддельных новостей. это один столбец прямо сейчас под "размером эффекта", а другой столбец, который определяет размер эффекта для тегирования. Это исследование связано с таблицей под названием "стратегия", где "тегирование новостей" имеет оценку воздействия, а затем "таблица продуктов", которая ссылается на стратегию тегирования и объединяет ее с оценкой поддельных новостей на Facebook, умножает два и дает потенциальное влияние.
В таблице товаров "пометка поддельных новостей" это собственный столбец. Но, если это будет продолжаться, каждая строка будет иметь тысячи столбцов для каждой возможной стратегии и исследовательской цитаты.
https://airtable.com/shrZFTrdIe4TshEHs
Должен быть лучший способ организовать это. Это слишком громоздко сейчас.
Я надеюсь, что этот вопрос был несколько ясен, и не стесняйтесь, дайте мне знать, как я могу облегчить ответ на вопрос. благодарю вас