Хватка неизменных структур данных

Question

Хватка неизменных структур данных

Я изучаю scala и, будучи хорошим учеником, стараюсь соблюдать все правила, которые нашел.

Одно из правил: НЕИЗБЕЖНОСТЬ!!!

Поэтому я попытался закодировать все с неизменными структурами данных и значениями, и иногда это действительно сложно.

Но сегодня я подумал про себя: единственное, что важно, это то, что объект / класс не должен иметь изменяемого состояния. Я не обязан кодировать все методы в неизменном стиле, потому что эти методы не влияют друг на друга.

Мой вопрос: я прав или есть какие-то проблемы / недостатки, которых я не вижу?

РЕДАКТИРОВАТЬ:

Пример кода для Айшвария:

def logLikelihood(seq: Iterator[T]): Double = {
  val sequence = seq.toList
  val stateSequence = (0 to order).toList.padTo(sequence.length,order)
  val seqPos = sequence.zipWithIndex

  def probOfSymbAtPos(symb: T, pos: Int) : Double = {
    val state = states(stateSequence(pos))
    M.log(state( seqPos.map( _._1 ).slice(0, pos).takeRight(order), symb))
  }

  val probs = seqPos.map( i => probOfSymbAtPos(i._1,i._2) )

  probs.sum
}

Пояснение: Это метод для вычисления логарифмической вероятности однородной марковской модели переменного порядка. Метод применения состояния принимает все предыдущие символы и предстоящий символ и возвращает вероятность этого.

Как вы можете видеть: весь метод просто умножает некоторые вероятности, что было бы намного проще при использовании переменных.

19

scala data-structures functional-programming immutability

Источник

user928752 01 дек '11 в 18:07

3 ответа

Решение

Кейс для функционального программирования - это быть лаконичным в вашем коде и использовать более математический подход. Это может уменьшить вероятность ошибок и сделать ваш код меньше и более читабельным. Что касается простоты или нет, это требует, чтобы вы думали о своих проблемах по-другому. Но как только вы привыкнете мыслить с помощью функциональных паттернов, вполне вероятно, что функционал станет легче, чем более императивный стиль.

Действительно трудно быть полностью функциональным и иметь нулевое изменяемое состояние, но очень выгодно иметь минимальное изменяемое состояние. Следует помнить, что все должно быть сбалансировано, а не до предела. Сокращая количество изменяемого состояния, вы тем самым усложняете написание кода с непредвиденными последствиями. Обычным примером является наличие изменяемой переменной, значение которой является неизменным. Таким образом, идентичность (именованная переменная) и значение (неизменяемый объект, которому может быть назначена переменная) разделены.

var acc: List[Int] = Nil
// lots of complex stuff that adds values
acc ::= 1
acc ::= 2
acc ::= 3
// do loop current list
acc foreach { i => /* do stuff that mutates acc */ acc ::= i * 10 }
println( acc ) // List( 1, 2, 3, 10, 20, 30 )

Foreach зацикливается на значении acc во время запуска foreach. Любые мутации в acc не влияют на цикл. Это намного безопаснее, чем типичные итераторы в Java, где список может измениться в середине итерации.

Существует также проблема параллелизма. Неизменяемые объекты полезны из-за спецификации модели памяти JSR-133, в которой утверждается, что инициализация конечных элементов объекта произойдет до того, как какой-либо поток сможет увидеть эти элементы, точка! Если они не являются окончательными, то они являются "изменяемыми", и нет гарантии правильной инициализации.

Актеры - идеальное место, чтобы поставить изменчивое состояние. Объекты, которые представляют данные, должны быть неизменными. Возьмите следующий пример.

object MyActor extends Actor {
  var acc: List[Int] = Nil
  def act() {
    loop {
      react {
        case i: Int => acc ::= i
        case "what is your current value" => reply( acc )
        case _ => // ignore all other messages
      }
    }
  }
}

В этом случае мы можем отправить значение acc (которое является List) и не беспокоиться о синхронизации, поскольку List является неизменным, то есть все члены объекта List являются окончательными. Также из-за неизменности мы знаем, что ни один другой субъект не может изменить базовую структуру данных, которая была отправлена, и, следовательно, ни один другой субъект не может изменить изменяемое состояние этого субъекта.

7

Источник

user352542 01 дек '11 в 18:50

Поскольку Apocalisp уже упомянул материал, на котором я собирался процитировать его, я буду обсуждать код. Вы говорите, что это просто умножение, но я не вижу этого - оно ссылается как минимум на три важных метода, определенных снаружи: order, states а также M.log, Я могу сделать вывод, что order является Intи что states вернуть функцию, которая принимает List[T] и T и возвращается Double,

Там также происходят некоторые странные вещи...

def logLikelihood(seq: Iterator[T]): Double = {
  val sequence = seq.toList

sequence никогда не используется, кроме как для определения seqPosтак зачем это делать?

  val stateSequence = (0 to order).toList.padTo(sequence.length,order)
  val seqPos = sequence.zipWithIndex

  def probOfSymbAtPos(symb: T, pos: Int) : Double = {
    val state = states(stateSequence(pos))
    M.log(state( seqPos.map( _._1 ).slice(0, pos).takeRight(order), symb))

На самом деле, вы могли бы использовать sequence здесь вместо seqPos.map( _._1 ), так как все, что делает, это отменить zipWithIndex, Также, slice(0, pos) просто take(pos),

  }

  val probs = seqPos.map( i => probOfSymbAtPos(i._1,i._2) )

  probs.sum
}

Теперь, учитывая отсутствующие методы, трудно утверждать, как это действительно должно быть написано в функциональном стиле. Хранение таинственных методов даст:

def logLikelihood(seq: Iterator[T]): Double = {
  import scala.collection.immutable.Queue
  case class State(index: Int, order: Int, slice: Queue[T], result: Double)

  seq.foldLeft(State(0, 0, Queue.empty, 0.0)) {
    case (State(index, ord, slice, result), symb) =>
      val state = states(order)
      val partial = M.log(state(slice, symb))
      val newSlice = slice enqueue symb
      State(index + 1, 
            if (ord == order) ord else ord + 1, 
            if (queue.size > order) newSlice.dequeue._2 else newSlice,
            result + partial)
  }.result
}

Только я подозреваю state/M.log вещи могут быть сделаны частью State также. Я замечаю другие оптимизации сейчас, когда я написал это так. Раздвижное окно, которое вы используете, напоминает мне, конечно, sliding:

seq.sliding(order).zipWithIndex.map { 
  case (slice, index) => M.log(states(index + order)(slice.init, slice.last))
}.sum

Это будет начинаться только с элемента orderth, так что некоторая адаптация будет в порядке. Не слишком сложно, хотя. Итак, давайте перепишем это снова:

def logLikelihood(seq: Iterator[T]): Double = {
  val sequence = seq.toList
  val slices = (1 until order).map(sequence take) ::: sequence.sliding(order)
  slices.zipWithIndex.map { 
    case (slice, index) => M.log(states(index)(slice.init, slice.last))
  }.sum
}

Я хотел бы видеть M.log а также states... держу пари map в foldLeft и покончить с этими двумя методами. И я подозреваю, что метод вернулся states может взять весь срез вместо двух параметров.

Все еще... не плохо, не так ли?

3

Источник

user53013 01 дек '11 в 21:36

Другие вопросы по тегам scala data-structures functional-programming immutability

user3434 01 дек '11 в 18:59 2011-12-01 18:59 · Accepted Answer · 2011-12-01 18:59

Правило на самом деле не неизменяемость, а ссылочная прозрачность. Вполне нормально использовать изменяемые локально переменные и массивы, потому что ни один из эффектов не наблюдается ни для каких других частей общей программы.

Принцип ссылочной прозрачности (RT) заключается в следующем:

Выражение e ссылочно прозрачно, если для всех программ p каждый случай e в p может быть заменен результатом оценки eбез влияния на наблюдаемый результат p,

Обратите внимание, что если e создает и мутирует некое локальное состояние, оно не нарушает RT, так как никто не может наблюдать это.

Тем не менее, я очень сомневаюсь, что ваша реализация более проста с vars.