Заменить текст и цвет фона текстового документа

Я хотел бы создать шаблон с тегами, которые выделены. Теги должны быть заменены некоторыми данными с R, Я выделил текст в файле шаблона и хочу пустой фон в выходном файле.

я пробовал officer потому что это, кажется, самый зрелый R-пакет для манипулирования word документы. Я попробовал body_replace_all_text и body_replace_text_at_bkm Функция, но ни один, кажется, не предоставляет возможности изменить форматирование.

Я полностью открыт для другого подхода. Жесткие требования заключаются в том, что шаблон и выходной файл должны редактироваться нетехническим сотрудником (таким образом, текстовым документом), а поля ввода в шаблоне должны быть как-то выделены. Это означает, что если сотрудник вручную отредактирует шаблон, он не пропустит ни одного тега.

Код

library(officer)
library(magrittr)

template <- read_docx("template.docx")

pattern <- "<tags>"
replacement <- "tags"
template <- template %>%
  body_replace_all_text(pattern, replacement)

pattern <- "<color.*?/color>"
replacement <- "yellow"
template <- template %>%
  body_replace_all_text(pattern, replacement)

print(template, target = "output.docx")

template.docx

template.docx

output.docx

desired_output.docx

редактировать

Решил эту проблему, исправив officer пакет. Это немного странно, поэтому я все еще открыт для более чистого решения.

replace_all_text.custom = function( oldValue, newValue, onlyAtCursor=TRUE, warn = TRUE, ... ) {

  oldValue <- enc2utf8(oldValue)
  newValue <- enc2utf8(newValue)

  replacement_count <- 0

  base_node <- if (onlyAtCursor) self$get_at_cursor() else self$get()

  # For each matching text node...
  for (text_node in xml_find_all(base_node, ".//w:t")) {
    # ...if it contains the oldValue...
    if (grepl(oldValue, xml_text(text_node), ...)) {
      replacement_count <- replacement_count + 1
      # Replace the node text with the newValue.
      xml_text(text_node) <- gsub(oldValue, newValue, xml_text(text_node), ...)
      # remove background color
      xml_remove(xml_find_all(text_node, "..//w:highlight"))
    }
  }

  # Alert the user if no replacements were made.
  if (replacement_count == 0 && warn) {
    search_zone_text <- if (onlyAtCursor) "at the cursor." else "in the document."
    warning("Found 0 instances of '", oldValue, "' ", search_zone_text)
  }

  self
}

docx_part.custom <- officer:::docx_part
docx_part.custom$public_methods$replace_all_text <- replace_all_text.custom

assignInNamespace("docx_part", docx_part.custom, ns = "officer")

0 ответов

Другие вопросы по тегам