Убедитесь, что файлы конвертированы CRLF в LF в хуке обновления - есть ли снижение производительности?

Было много дискуссий о функциях core.autocrlf и core.safecrlf в текущем и следующем выпусках. Вопрос, который у меня есть, относится к среде, в которой разработчики клонируют из чистого хранилища.

Во время клона настройки autocrlf включены. Но поскольку разработчики имеют полный контроль над своим клоном, они могут удалить эту настройку autocrlf и продолжить.

  1. Мы можем указать файлы, отличные от двоичного файла, в файле.gitattributes, но есть ли другой способ, которым GIT автоматически определяет, является ли файл текстовым или двоичным файлом?

  2. Есть ли способ, подобный зацепке обновления (зацепка фиксации невозможна, поскольку разработчики все еще могут ее удалить), которую можно разместить, чтобы убедиться, что файлы (с CRLF) выталкиваются из среды Windows на машину UNIX, на которой размещается пустое хранилище, конвертируется в формат UNIX EOL (LF)?

  3. Повлияет ли наличие таких хуков обновления, которые сканируют каждый файл на наличие CRLF, на производительность операции push?

Спасибо

1 ответ

Решение
  • 1/ У самого Git есть эвристика для определения, является ли файл двоичным или текстовым (аналогично istext)

  • 2 / В блоге gergap недавно (в мае 2010 г.) появилась та же идея.
    Посмотрите его хук обновления здесь (воспроизведенный в конце этого ответа), но хитрость заключается в следующем:
    Вместо того, чтобы пытаться преобразовать, ловушка просто отклонит push, если обнаружит (предположительно) недвоичный файл с неправильным стилем eol.

Git конвертирует LF->CRLF при проверке на винде.
Если файл уже содержит CRLF, Git достаточно умен, чтобы обнаружить это и не расширяет его CRCRLF что было бы не так. Это держит CRLF Это означает, что файл был неявно изменен локально во время извлечения, потому что при повторной фиксации неверно CRLF будет исправлено LF, Вот почему GIT должен пометить эти файлы как измененные.

Это хорошо, чтобы понять проблему, но нам нужно решение, которое предотвращает выталкивание неправильных концов линии в центральное репо.
Решение состоит в том, чтобы установить хук обновления на центральном сервере.

  • 3 / Это будет небольшая цена, но если вы не нажимаете каждые 30 секунд, это не должно быть проблемой.
    Плюс фактическое преобразование не происходит: если файл неверен, push отклоняется.
    Это ставит проблему конвертации прямо туда, где она должна быть: на стороне разработчика.

#!/bin/sh
#
# Author: Gerhard Gappmeier, ascolab GmbH
# This script is based on the update.sample in git/contrib/hooks.
# You are free to use this script for whatever you want.
#
# To enable this hook, rename this file to "update".
#

# --- Command line
refname="$1"
oldrev="$2"
newrev="$3"
#echo "COMMANDLINE: $*"

# --- Safety check
if [ -z "$GIT_DIR" ]; then
    echo "Don't run this script from the command line." >&2
    echo " (if you want, you could supply GIT_DIR then run" >&2
    echo "  $0 <ref> <oldrev> <newrev>)" >&2
    exit 1
fi

if [ -z "$refname" -o -z "$oldrev" -o -z "$newrev" ]; then
    echo "Usage: $0 <ref> <oldrev> <newrev>" >&2
    exit 1
fi

BINARAY_EXT="pdb dll exe png gif jpg"

# returns 1 if the given filename is a binary file
function IsBinary() 
{
    result=0
    for ext in $BINARAY_EXT; do
        if [ "$ext" = "${1#*.}" ]; then
            result=1
            break
        fi
    done

    return $result
}

# make temp paths
tmp=$(mktemp /tmp/git.update.XXXXXX)
log=$(mktemp /tmp/git.update.log.XXXXXX)    
tree=$(mktemp /tmp/git.diff-tree.XXXXXX)
ret=0

git diff-tree -r "$oldrev" "$newrev" > $tree
#echo
#echo diff-tree:
#cat $tree

# read $tree using the file descriptors
exec 3<&0
exec 0<$tree
while read old_mode new_mode old_sha1 new_sha1 status name
do
    # debug output
    #echo "old_mode=$old_mode new_mode=$new_mode old_sha1=$old_sha1 new_sha1=$new_sha1 status=$status name=$name"
    # skip lines showing parent commit
    test -z "$new_sha1" && continue
    # skip deletions
    [ "$new_sha1" = "0000000000000000000000000000000000000000" ] && continue

    # don't do a CRLF check for binary files
    IsBinary $tmp
    if [ $? -eq 1 ]; then
        continue # skip binary files
    fi

    # check for CRLF
    git cat-file blob $new_sha1 > $tmp
    RESULT=`grep -Pl '\r\n' $tmp`
    echo $RESULT
    if [ "$RESULT" = "$tmp" ]; then
        echo "###################################################################################################"
        echo "# '$name' contains CRLF! Dear Windows developer, please activate the GIT core.autocrlf feature,"
        echo "# or change the line endings to LF before trying to push."
        echo "# Use 'git config core.autocrlf true' to activate CRLF conversion."
        echo "# OR use 'git reset HEAD~1' to undo your last commit and fix the line endings."
        echo "###################################################################################################"
        ret=1
    fi
done
exec 0<&3
# --- Finished
exit $ret
Другие вопросы по тегам