Как отобразить различные значения из 2 наборов в clojure на основе уникального значения
У меня есть функция, которая дает данные
{{id 1,:obs/A "11", :obs/value 2.0, :obs/color "yellow"}
{id 2,:obs/A "12", :obs/value 4.0, :obs/color "blue"}
{id 3,:obs/A "13", :obs/value 3.0, :obs/color "green"}
{id 3,:obs/A "15", :obs/value 7.0, :obs/color "red"}...}
and a function B which gives the data
{{id 2,:obs/A "11", :obs/value 7.0, :obs/shape "square"}
{id 2,:obs/A "13", :obs/value 4.0, :obs/shape "circle"}
{id 6,:obs/A "15", :obs/value 3.0, :obs/shape "triangle"}...}
I want to map obs/value from both functions which match with same obs/A.
Here the result will be like {(2.0,7.0),(3.0,4.0)..}
Я использую функции фильтра и карту, но не могу получить правильный код.
Спасибо.
5 ответов
ОБНОВЛЕНИЕ 2016-09-26 1727: Я добавил лучшее решение, которое использует DataScript для выполнения всей тяжелой работы. Пожалуйста, смотрите дополнительное решение в конце.
Вот ответ, который работает (без DataScript):
(ns clj.core
(:require [tupelo.core :as t]
[clojure.set :as set] ))
(t/refer-tupelo)
(def x
[ {:id 1, :obs/A "11", :obs/value 2.0, :obs/color "yellow"}
{:id 2, :obs/A "12", :obs/value 4.0, :obs/color "blue"}
{:id 3, :obs/A "13", :obs/value 3.0, :obs/color "green"}
{:id 3, :obs/A "15", :obs/value 7.0, :obs/color "red"} ] )
(def y
[ {:id 2, :obs/A "11", :obs/value 7.0, :obs/shape "square"}
{:id 2, :obs/A "13", :obs/value 4.0, :obs/shape "circle"}
{:id 6, :obs/A "15", :obs/value 3.0, :obs/shape "triangle"} ] )
(newline) (println "x") (pretty x)
(newline) (println "y") (pretty y)
; Note this assumes that :obs/A is unique in each sequence x and y
(def xa (group-by :obs/A x))
(def ya (group-by :obs/A y))
(newline) (println "xa") (pretty xa)
(newline) (println "ya") (pretty ya)
(def common-a (set/intersection (set (keys xa)) (set (keys ya))))
(newline) (spyx common-a)
(def values-map
(apply glue
(for [aval common-a]
{ (-> aval xa only :obs/value)
(-> aval ya only :obs/value) } )))
(newline) (spyx values-map)
> lein run
x
[{:id 1, :obs/A "11", :obs/value 2.0, :obs/color "yellow"}
{:id 2, :obs/A "12", :obs/value 4.0, :obs/color "blue"}
{:id 3, :obs/A "13", :obs/value 3.0, :obs/color "green"}
{:id 3, :obs/A "15", :obs/value 7.0, :obs/color "red"}]
y
[{:id 2, :obs/A "11", :obs/value 7.0, :obs/shape "square"}
{:id 2, :obs/A "13", :obs/value 4.0, :obs/shape "circle"}
{:id 6, :obs/A "15", :obs/value 3.0, :obs/shape "triangle"}]
xa
{"11" [{:id 1, :obs/A "11", :obs/value 2.0, :obs/color "yellow"}],
"12" [{:id 2, :obs/A "12", :obs/value 4.0, :obs/color "blue"}],
"13" [{:id 3, :obs/A "13", :obs/value 3.0, :obs/color "green"}],
"15" [{:id 3, :obs/A "15", :obs/value 7.0, :obs/color "red"}]}
ya
{"11" [{:id 2, :obs/A "11", :obs/value 7.0, :obs/shape "square"}],
"13" [{:id 2, :obs/A "13", :obs/value 4.0, :obs/shape "circle"}],
"15" [{:id 6, :obs/A "15", :obs/value 3.0, :obs/shape "triangle"}]}
common-a => #{"15" "13" "11"}
values-map => {7.0 3.0, 3.0 4.0, 2.0 7.0}
Это похоже на создание мини-базы данных и запрос (псевдокод sql):
select x.value, y.value from
(natural join x, y on A)
Если вы делаете это много, вы можете обнаружить, что использование реальной БД, такой как PostgreSQL или Datomic, полезно, или для вещей только с памятью рассмотрите clojure lib DataScript.
Вот ответ DataScript:
(ns clj.core
(:require [tupelo.core :as t]
[datascript.core :as d]
[clojure.set :as set] ))
(t/refer-tupelo)
(def data
[ {:type :x :local/id 1, :obs/A "11", :obs/value 2.0, :obs/color "yellow"}
{:type :x :local/id 2, :obs/A "12", :obs/value 4.0, :obs/color "blue"}
{:type :x :local/id 3, :obs/A "13", :obs/value 3.0, :obs/color "green"}
{:type :x :local/id 3, :obs/A "15", :obs/value 7.0, :obs/color "red"}
{:type :y :local/id 2, :obs/A "11", :obs/value 7.0, :obs/shape "square"}
{:type :y :local/id 2, :obs/A "13", :obs/value 4.0, :obs/shape "circle"}
{:type :y :local/id 6, :obs/A "15", :obs/value 3.0, :obs/shape "triangle"} ] )
(def conn (d/create-conn {}))
(d/transact! conn data)
(def labelled-result
(d/q '[:find ?a ?value1 ?value2
:where
[?ex :type :x] [?ex :obs/A ?a] [?ex :obs/value ?value1]
[?ey :type :y] [?ey :obs/A ?a] [?ey :obs/value ?value2]
] @conn ))
(newline) (println "labelled-result") (pretty labelled-result)
(def unlabelled-result
(d/q '[:find ?value1 ?value2
:where
[?ex :type :x] [?ex :obs/A ?a] [?ex :obs/value ?value1]
[?ey :type :y] [?ey :obs/A ?a] [?ey :obs/value ?value2]
] @conn ))
(newline) (println "unlabelled-result") (pretty unlabelled-result)
> lein run
labelled-result
#{["13" 3.0 4.0] ["11" 2.0 7.0] ["15" 7.0 3.0]}
unlabelled-result
#{[3.0 4.0] [2.0 7.0] [7.0 3.0]}
Если вы знаете, что не будет предметов с таким же :obs/A
в том же наборе, вы можете просто объединить оба набора, сгруппировать их по :obs/A
и сохраните значения там, где в группе 2 элемента:
user> (def rel1 #{{:id 1,:obs/A "11", :obs/value 2.0, :obs/color "yellow"}
{:id 2,:obs/A "12", :obs/value 4.0, :obs/color "blue"}
{:id 3,:obs/A "13", :obs/value 3.0, :obs/color "green"}
{:id 3,:obs/A "15", :obs/value 7.0, :obs/color "red"}})
#'user/rel1
user> (def rel2 #{{:id 2,:obs/A "11", :obs/value 7.0, :obs/shape "square"}
{:id 2,:obs/A "13", :obs/value 4.0, :obs/shape "circle"}
{:id 6,:obs/A "15", :obs/value 3.0, :obs/shape "triangle"}})
#'user/rel2
user> (keep (fn [[_ v]] (when (> (count v) 1) (map :obs/value v)))
(group-by :obs/A (concat rel1 rel2)))
;;=> ((3.0 4.0) (7.0 3.0) (2.0 7.0))
в противном случае вы должны сначала найти :obs/A
Значения присутствуют в обеих коллекциях, а затем найдите соответствующие значения:
user> (let [r1 (group-by :obs/A rel1)
r2 (group-by :obs/A rel2)
;; keysets intersection
ks (keep (set (keys r1)) (keys r2))]
(map #(map :obs/value (concat (r1 %) (r2 %)))
ks))
;;=> ((2.0 7.0) (7.0 3.0) (3.0 4.0))
Хорошо, я не уверен на 100%, что понял вашу проблему, но из того, что вы описали, у вас есть два списка произвольных карт, и вы собираете конкретные элементы из всех карт в список. Вероятно, есть реальный способ сделать это с одним из слияний (возможно, слиянием-fn?), Но, используя обычный старый метод Reduce, вы можете сделать это так:
(vals (reduce
(fn[acc i]
(let [k (:key i)
v (:value i)]
(assoc acc k (conj (acc k) v)))) {} (concat a n)))
Давайте внимательнее посмотрим. Начиная с конца:
(concat a n)
Я объединяю списки, потому что вы указали, что они являются полностью независимыми списками карт. В списке нет уникальности, поэтому не помешает рассматривать их как один список.
{}
Я прохожу в пустой карте. Нам нужна карта, потому что при ее создании нам нужно отслеживать, куда мы помещаем вещи, используя наш предпочтительный ключ. Чтобы уменьшить, я передаю функцию:
(fn[acc i]
Требуется аккумулятор и элемент (соотв. И я соответственно). Мы вытащим ключ от i, который является нашей картой:
(let [k (:key i)
Я использовал: ключ для ясности, но в вашем примере вы бы хотели obs/A. Тогда я беру значение:
v (:value i)]
Затем я связал значение с ключом в аккумуляторе, соединив его с тем, что уже есть:
(assoc acc k (conj (acc k) v))))
Это хороший трюк, чтобы знать:
(conj nil :whatever)
возвращается
'(whatever)
а также:
(conj '(:whatever) :something)
возвращает:
'(:whatever :something)
Таким образом, вам не нужно делать ничего особенного для первого случая.
Когда мы все закончим, у нас будет карта со всеми связанными значениями, как в моем случае я сделал это:
(def a [{:key 1 :value 2}{:key 2 :value 3}])
(def n [{:key 1 :value 3}{:key 2 :value 4}])
Таким образом, только сокращение возвращает:
=> {1 (3 2), 2 (4 3)}
Нам просто нужны значения карты, поэтому мы обертываем все это в vals и вуаля:
'((3 2) (4 3))
Надеюсь, это поможет.
Использование clojure.set:
(def a #{{:id 1,:obs/A "11", :obs/value 2.0, :obs/color "yellow"}
{:id 2,:obs/A "12", :obs/value 4.0, :obs/color "blue"}
{:id 3,:obs/A "13", :obs/value 3.0, :obs/color "green"}
{:id 3,:obs/A "15", :obs/value 7.0, :obs/color "red"}})
(def b #{{:id 2,:obs/A "11", :obs/value 7.0, :obs/shape "square"}
{:id 2,:obs/A "13", :obs/value 4.0, :obs/shape "circle"}
{:id 6,:obs/A "15", :obs/value 3.0, :obs/shape "triangle"}})
(use 'clojure.set)
(->> [a b]
(map #(index % [:obs/A]))
(apply merge-with union)
vals
(map (partial map :obs/value)))
Ответ: ((3,0 4,0) (4,0) (3,0 7,0) (7,0 2,0))
Куда data
это комбинированные ответы:
(into {} (for [[k v] (group-by :obs/A data)]
(if (= 2 (count v))
[k (map :obs/value v)])))
=> {"11" (2.0 7.0), "13" (3.0 4.0), "15" (7.0 3.0)}
Если вы хотите это без использования ярлыков vals