Git: узнай, какие коммиты когда-либо касались ряда строк

У меня проблемы с выяснением, как использовать git blame для получения набора коммитов, которые когда-либо касались заданного диапазона строк. Есть похожие вопросы, подобные этому, но принятый ответ не продвигает меня намного дальше.

Допустим, у меня есть определение, которое начинается в строке 1000 foo.rb, Это всего лишь 5 строк, но количество коммитов, которые когда-либо меняли эти строки, огромно. Если я сделаю

git blame foo.rb -L 1000,+5

Я получаю ссылки на (самое большее) пять различных коммитов, которые изменили эти строки, но меня также интересуют коммиты "за ними".

Так же,

git rev-list HEAD -- foo.rb | xargs git log --oneline

это почти то, что я хочу, но я не могу указать диапазон строк git rev-list

Могу ли я передать флаг git blame получить список коммитов, которые когда-либо затрагивали эти пять строк, или какой самый быстрый способ создать скрипт, который извлекает такую ​​информацию? Давайте пока проигнорируем возможность того, что определение когда-то содержало более или менее 5 строк.

6 ответов

Решение

Начиная с Git 1.8.4, git log имеет -L просматривать эволюцию ряда линий.

Например, предположим, вы смотрите на git blame выход:

((aa27064...))[mlm@macbook:~/w/mlm/git]
$ git blame -L150,+11 -- git-web--browse.sh
a180055a git-web--browse.sh (Giuseppe Bilotta 2010-12-03 17:47:36 +0100 150)            die "The browser $browser is not
a180055a git-web--browse.sh (Giuseppe Bilotta 2010-12-03 17:47:36 +0100 151)    fi
5d6491c7 git-browse-help.sh (Christian Couder 2007-12-02 06:07:55 +0100 152) fi
5d6491c7 git-browse-help.sh (Christian Couder 2007-12-02 06:07:55 +0100 153) 
5d6491c7 git-browse-help.sh (Christian Couder 2007-12-02 06:07:55 +0100 154) case "$browser" in
81f42f11 git-web--browse.sh (Giuseppe Bilotta 2010-12-03 17:47:38 +0100 155) firefox|iceweasel|seamonkey|iceape)
5d6491c7 git-browse-help.sh (Christian Couder 2007-12-02 06:07:55 +0100 156)    # Check version because firefox < 2.0 do
5d6491c7 git-browse-help.sh (Christian Couder 2007-12-02 06:07:55 +0100 157)    vers=$(expr "$($browser_path -version)" 
5d6491c7 git-browse-help.sh (Christian Couder 2007-12-02 06:07:55 +0100 158)    NEWTAB='-new-tab'
5d6491c7 git-browse-help.sh (Christian Couder 2007-12-02 06:07:55 +0100 159)    test "$vers" -lt 2 && NEWTAB=''
a0685a4f git-web--browse.sh (Dmitry Potapov   2008-02-09 23:22:22 -0800 160)    "$browser_path" $NEWTAB "$@" &

И вы хотите узнать историю того, что сейчас линия 155.

Затем:

((aa27064...))[mlm@macbook:~/w/mlm/git]
$ git log --topo-order --graph -u -L 155,155:git-web--browse.sh
* commit 81f42f11496b9117273939c98d270af273c8a463
| Author: Giuseppe Bilotta <giuseppe.bilotta@gmail.com>
| Date:   Fri Dec 3 17:47:38 2010 +0100
| 
|     web--browse: support opera, seamonkey and elinks
|     
|     The list of supported browsers is also updated in the documentation.
|     
|     Signed-off-by: Giuseppe Bilotta <giuseppe.bilotta@gmail.com>
|     Signed-off-by: Junio C Hamano <gitster@pobox.com>
| 
| diff --git a/git-web--browse.sh b/git-web--browse.sh
| --- a/git-web--browse.sh
| +++ b/git-web--browse.sh
| @@ -143,1 +143,1 @@
| -firefox|iceweasel)
| +firefox|iceweasel|seamonkey|iceape)
|  
* commit a180055a47c6793eaaba6289f623cff32644215b
| Author: Giuseppe Bilotta <giuseppe.bilotta@gmail.com>
| Date:   Fri Dec 3 17:47:36 2010 +0100
| 
|     web--browse: coding style
|     
|     Retab and deindent choices in case statements.
|     
|     Signed-off-by: Giuseppe Bilotta <giuseppe.bilotta@gmail.com>
|     Signed-off-by: Junio C Hamano <gitster@pobox.com>
| 
| diff --git a/git-web--browse.sh b/git-web--browse.sh
| --- a/git-web--browse.sh
| +++ b/git-web--browse.sh
| @@ -142,1 +142,1 @@
| -    firefox|iceweasel)
| +firefox|iceweasel)
|  
* commit 5884f1fe96b33d9666a78e660042b1e3e5f9f4d9
  Author: Christian Couder <chriscool@tuxfamily.org>
  Date:   Sat Feb 2 07:32:53 2008 +0100

      Rename 'git-help--browse.sh' to 'git-web--browse.sh'.

      Signed-off-by: Christian Couder <chriscool@tuxfamily.org>
      Signed-off-by: Junio C Hamano <gitster@pobox.com>

  diff --git a/git-web--browse.sh b/git-web--browse.sh
  --- /dev/null
  +++ b/git-web--browse.sh
  @@ -0,0 +127,1 @@
  +    firefox|iceweasel)

Если вы часто используете эту функцию, вам может пригодиться псевдоним git. Для этого вставьте в свой ~/.gitconfig:

[alias]
    # Follow evolution of certain lines in a file
    # arg1=file, arg2=first line, arg3=last line or blank for just the first line
    follow = "!sh -c 'git log --topo-order -u -L $2,${3:-$2}:"$1"'" -

И теперь вы можете просто сделать git follow git-web--browse.sh 155,

Я думаю, что это то, что вы хотите:

git rev-list HEAD -- foo.rb | ( 
    while read rev; do
        git blame -l -L 1000,+5 $rev -- foo.rb | cut -d ' ' -f 1
    done;
) | awk '{ if (!h[$0]) { print $0; h[$0]=1 } }'

Это выведет номер ревизии для каждого коммита, который имеет редактирование выбранных вами строк.

Вот шаги:

  1. Первая часть git rev-list HEAD -- foo.rb выводит все ревизии, в которых редактируется выбранный файл.

  2. Каждая из этих ревизий затем переходит во вторую часть, которая берет каждую и помещает ее в git blame -l -L 1000,+5 $rev -- foo.rb | cut -d ' ' -f 1, Это команда из двух частей.

    1. git blame -l -L 1000,+5 $rev -- foo.rb выводит вину за выбранные строки. Предоставляя ему номер ревизии, мы говорим ему начинать с этого коммита и идти оттуда, а не начинать с головы.
    2. Поскольку вина выводит кучу информации, которая нам не нужна, cut -d ' ' -f 1 дает нам первый столбец (номер ревизии) вывода обвинений.
  3. awk '{ if (!h[$0]) { print $0; h[$0]=1 } }' удаляет несмежные дубликаты строк, сохраняя порядок, в котором они появились. См. http://jeetworks.org/node/94 для получения дополнительной информации об этой команде.

Вы можете добавить последний шаг здесь, чтобы получить более симпатичный вывод. Труба все в xargs -L 1 git log --oneline -1 и получите соответствующее сообщение коммита для списка ревизий. У меня была странная проблема, связанная с этим последним шагом, когда мне приходилось нажимать следующие несколько выходных ревизий. Я не уверен, почему это было, поэтому я не включил его в свое решение.

Не уверен, что вы хотите сделать, но, возможно, git log -S поможет вам:

-S<string>
    Look for differences that introduce or remove an instance of <string>. 
    Note that this is different than the string simply appearing
    in diff output; see the pickaxe entry in gitdiffcore(7) for more
    details.

Вы можете вставить в строку изменения (или часть изменения), за которыми вы пытаетесь следовать, и в этом списке будут перечислены коммиты, которые когда-либо касались этого изменения.

Пожалуйста, обратитесь к ответу, опубликованному здесь. Перечислите все коммиты для определенного файла. Это именно то, что вам нужно.

Мне понравилась эта головоломка, в ней есть свои тонкости. Источник этого файла, скажем init foo.rb 1000,1005 и следуйте инструкциям. Когда вы закончите, файл @changes будет иметь правильный список коммитов в топологическом порядке и @blames будет иметь фактический результат обвинения от каждого.

Это значительно сложнее, чем принятое решение выше. Он производит выходные данные, которые иногда будут более полезными и трудными для воспроизведения, и это было весело для кода.

Проблема с попыткой автоматического отслеживания диапазонов номеров строк при переходе назад в историю заключается в том, что если блок изменений пересекает границы диапазона с номерами строк, вы не можете автоматически определить, где в этом блоке должна быть новая граница диапазона, и у вас также будет включить большой диапазон для больших дополнений и, таким образом, накапливать (иногда множество) не относящихся к делу изменений, или перейти в ручной режим, чтобы убедиться, что это правильно (что, конечно, возвращает вас обратно), или время от времени принимать экстремальные потери.

Если вы хотите, чтобы ваш вывод был точным, используйте ответ выше с надежными диапазонами регулярных выражений, такими как `/^type function(/,/^}/'), или используйте это, что на самом деле не так уж и плохо, пару секунд за шаг назад во время.

В обмен на дополнительную сложность он создает список совпадений в топологической последовательности и, по крайней мере (довольно успешно), пытается уменьшить боль на каждом этапе. Например, он никогда не использует избыточную вину, а диапазоны обновления упрощают настройку номеров строк. И, конечно же, есть надежда того, что мне приходилось по-отдельности смотреть на кусочки...:-P

Чтобы запустить это на полном авто, скажем, { init foo.rb /^class foo/,/^end/; auto; } 2>&-

 ### functions here create random @-prefix files in the current directory ###
#
# git blame history for a range, finding every change to that range
# throughout the available history.  It's somewhat, ahh, "intended for
# customization", is that enough of a warning?  It works as advertised
# but drops @-prefix temporary files in your current directory and
# defines new commands
#
# Source this file in a subshell, it defines functions for your use.
# If you have @-prefix files you care about, change all @ in this file
# to something you don't have and source it again.
#
#    init path/to/file [<start>,<end>]  # range optional
#    update-ranges           # check range boundaries for the next step
#    cycle [<start>,<end>]   # range unchanged if not supplied
#    prettyblame             # pretty colors, 
#       blue="child commit doesn't have this line"
#       green="parent commit doesn't have this line"
#           brown=both
#    shhh # silence the pre-cycle blurb
#
# For regex ranges, you can _usually_ source this file and say `init
# path/to/file /startpattern/,/endpattern/` and then cycle until it says 0
# commits remain in the checklist
#
# for line-number ranges, or regex ranges you think might be unworthy, you
# need to check and possibly update the range before each cycle.  File
# @next is the next blame start-point revision text; and command
# update-ranges will bring up vim with the current range V-selected.  If
# that looks good, `@M` is set up to quit even while selecting, so `@M` and
# cycle.  If it doesn't look good, 'o' and the arrow keys will make getting
# good line numbers easy, or you can find better regex's.  Either way, `@M`
# out and say `cycle <start>,<end>` to update the ranges.

init () { 
    file=$1;
    range="$2"
    rm -f @changes
    git rev-list --topo-order HEAD -- "$file" \
    | tee @checklist \
    | cat -n | sort -k2 > @sequence
    git blame "-ln${range:+L$range}" -- "$file" > @latest || echo >@checklist
    check-cycle
    cp @latest @blames
}

update-latest-checklist() {
    # update $latest with the latest sha that actually touched our range,
    # and delete that and everything later than that from the checklist.
    latest=$(
        sed s,^^,, @latest \
        | sort -uk1,1 \
        | join -1 2 -o1.1,1.2 @sequence - \
        | sort -unk1,1 \
        | sed 1q \
        | cut -d" " -f2
    )
    sed -i 1,/^$latest/d @checklist
}
shhh () { shhh=1; }

check-cycle () {
    update-latest-checklist
    sed -n q1 @checklist || git log $latest~..$latest --format=%H\ %s | tee -a @changes
    next=`sed 1q @checklist`
    git cat-file -p `git rev-parse $next:"$file"` > @next
    test -z "$shh$shhh$shhhh" && {
        echo "A blame from the (next-)most recent alteration (id `git rev-parse --short $latest`) to '$file'"
        echo is in file @latest, save its contents where you like
        echo 
        echo you will need to look in file @next to determine the correct next range,
        echo and say '`cycle its-start-line,its-end-line`' to continue
        echo the "update-ranges" function starts you out with the range selected
    } >&2
    ncommits=`wc -l @checklist | cut -d\  -f1`
    echo  $ncommits commits remain in the checklist >&2
    return $((ncommits==0))
}

update-ranges () {
    start="${range%,*}"
    end="${range#*,}"
    case "$start" in
    */*)    startcmd="1G$start"$'\n' ;;
    *)      startcmd="${start}G" ;;
    esac
    case "$end" in
    */*)    endcmd="$end"$'\n' ;;
    [0-9]*) endcmd="${end}G" ;;
    +[0-9]*) endcmd="${end}j" ;;
    *) endcmd="echohl Search|echo "can\'t" get to '${end}'\"|echohl None" ;;
    esac
    vim -c 'set buftype=nofile|let @m=":|q'$'\n"' -c "norm!${startcmd}V${endcmd}z.o" @next
}

cycle () {
    sed -n q1 @checklist && { echo "No more commits to check"; return 1; }
    range="${1:-$range}"
    git blame "-ln${range:+L$range}" $next -- "$file" >@latest || echo >@checklist
    echo >>@blames
    cat @latest >>@blames
    check-cycle
}

auto () {
    while cycle; do true; done
}

prettyblames () {
cat >@pretty <<-\EOD
BEGIN {
    RS=""
    colors[0]="\033[0;30m"
    colors[1]="\033[0;34m"
    colors[2]="\033[0;32m"
    colors[3]="\033[0;33m"
    getline commits < "@changes"
    split(commits,commit,/\n/)
}
NR!=1 { print "" }
{
    thiscommit=gensub(/ .*/,"",1,commit[NR])
    printf "%s\n","\033[0;31m"commit[NR]"\033[0m"
    split($0,line,/\n/)
    for ( n=1; n<=length(line); ++n ) {
        color=0
        split(line[n],key,/[1-9][0-9]*)/)
        if ( NR!=1 && !seen[key[1]] ) color+=1
        seen[key[1]]=1;
        linecommit = gensub(/ .*/,"",1,line[n])
        if (linecommit==thiscommit) color+=2
        printf "%s%s\033[0m\n",colors[color],line[n]
    }
}
EOD
awk -f @pretty @blames | less -R
}

Несколько мыслей..

Это похоже на этот пост, и похоже, что вы можете подобраться примерно так:

git blame -L '/variable_name *= */',+1

Пока вы знаете определение для сопоставления (для регулярного выражения).

Здесь обсуждается тема использования tig а также git gui (который, видимо, мог бы справиться с этим). Я сам еще не пробовал, поэтому не могу проверить это (попробую позже).

Другие вопросы по тегам