Git: узнай, какие коммиты когда-либо касались ряда строк
У меня проблемы с выяснением, как использовать git blame
для получения набора коммитов, которые когда-либо касались заданного диапазона строк. Есть похожие вопросы, подобные этому, но принятый ответ не продвигает меня намного дальше.
Допустим, у меня есть определение, которое начинается в строке 1000 foo.rb
, Это всего лишь 5 строк, но количество коммитов, которые когда-либо меняли эти строки, огромно. Если я сделаю
git blame foo.rb -L 1000,+5
Я получаю ссылки на (самое большее) пять различных коммитов, которые изменили эти строки, но меня также интересуют коммиты "за ними".
Так же,
git rev-list HEAD -- foo.rb | xargs git log --oneline
это почти то, что я хочу, но я не могу указать диапазон строк git rev-list
Могу ли я передать флаг git blame
получить список коммитов, которые когда-либо затрагивали эти пять строк, или какой самый быстрый способ создать скрипт, который извлекает такую информацию? Давайте пока проигнорируем возможность того, что определение когда-то содержало более или менее 5 строк.
6 ответов
Начиная с Git 1.8.4, git log
имеет -L
просматривать эволюцию ряда линий.
Например, предположим, вы смотрите на git blame
выход:
((aa27064...))[mlm@macbook:~/w/mlm/git]
$ git blame -L150,+11 -- git-web--browse.sh
a180055a git-web--browse.sh (Giuseppe Bilotta 2010-12-03 17:47:36 +0100 150) die "The browser $browser is not
a180055a git-web--browse.sh (Giuseppe Bilotta 2010-12-03 17:47:36 +0100 151) fi
5d6491c7 git-browse-help.sh (Christian Couder 2007-12-02 06:07:55 +0100 152) fi
5d6491c7 git-browse-help.sh (Christian Couder 2007-12-02 06:07:55 +0100 153)
5d6491c7 git-browse-help.sh (Christian Couder 2007-12-02 06:07:55 +0100 154) case "$browser" in
81f42f11 git-web--browse.sh (Giuseppe Bilotta 2010-12-03 17:47:38 +0100 155) firefox|iceweasel|seamonkey|iceape)
5d6491c7 git-browse-help.sh (Christian Couder 2007-12-02 06:07:55 +0100 156) # Check version because firefox < 2.0 do
5d6491c7 git-browse-help.sh (Christian Couder 2007-12-02 06:07:55 +0100 157) vers=$(expr "$($browser_path -version)"
5d6491c7 git-browse-help.sh (Christian Couder 2007-12-02 06:07:55 +0100 158) NEWTAB='-new-tab'
5d6491c7 git-browse-help.sh (Christian Couder 2007-12-02 06:07:55 +0100 159) test "$vers" -lt 2 && NEWTAB=''
a0685a4f git-web--browse.sh (Dmitry Potapov 2008-02-09 23:22:22 -0800 160) "$browser_path" $NEWTAB "$@" &
И вы хотите узнать историю того, что сейчас линия 155.
Затем:
((aa27064...))[mlm@macbook:~/w/mlm/git]
$ git log --topo-order --graph -u -L 155,155:git-web--browse.sh
* commit 81f42f11496b9117273939c98d270af273c8a463
| Author: Giuseppe Bilotta <giuseppe.bilotta@gmail.com>
| Date: Fri Dec 3 17:47:38 2010 +0100
|
| web--browse: support opera, seamonkey and elinks
|
| The list of supported browsers is also updated in the documentation.
|
| Signed-off-by: Giuseppe Bilotta <giuseppe.bilotta@gmail.com>
| Signed-off-by: Junio C Hamano <gitster@pobox.com>
|
| diff --git a/git-web--browse.sh b/git-web--browse.sh
| --- a/git-web--browse.sh
| +++ b/git-web--browse.sh
| @@ -143,1 +143,1 @@
| -firefox|iceweasel)
| +firefox|iceweasel|seamonkey|iceape)
|
* commit a180055a47c6793eaaba6289f623cff32644215b
| Author: Giuseppe Bilotta <giuseppe.bilotta@gmail.com>
| Date: Fri Dec 3 17:47:36 2010 +0100
|
| web--browse: coding style
|
| Retab and deindent choices in case statements.
|
| Signed-off-by: Giuseppe Bilotta <giuseppe.bilotta@gmail.com>
| Signed-off-by: Junio C Hamano <gitster@pobox.com>
|
| diff --git a/git-web--browse.sh b/git-web--browse.sh
| --- a/git-web--browse.sh
| +++ b/git-web--browse.sh
| @@ -142,1 +142,1 @@
| - firefox|iceweasel)
| +firefox|iceweasel)
|
* commit 5884f1fe96b33d9666a78e660042b1e3e5f9f4d9
Author: Christian Couder <chriscool@tuxfamily.org>
Date: Sat Feb 2 07:32:53 2008 +0100
Rename 'git-help--browse.sh' to 'git-web--browse.sh'.
Signed-off-by: Christian Couder <chriscool@tuxfamily.org>
Signed-off-by: Junio C Hamano <gitster@pobox.com>
diff --git a/git-web--browse.sh b/git-web--browse.sh
--- /dev/null
+++ b/git-web--browse.sh
@@ -0,0 +127,1 @@
+ firefox|iceweasel)
Если вы часто используете эту функцию, вам может пригодиться псевдоним git. Для этого вставьте в свой ~/.gitconfig
:
[alias]
# Follow evolution of certain lines in a file
# arg1=file, arg2=first line, arg3=last line or blank for just the first line
follow = "!sh -c 'git log --topo-order -u -L $2,${3:-$2}:"$1"'" -
И теперь вы можете просто сделать git follow git-web--browse.sh 155
,
Я думаю, что это то, что вы хотите:
git rev-list HEAD -- foo.rb | (
while read rev; do
git blame -l -L 1000,+5 $rev -- foo.rb | cut -d ' ' -f 1
done;
) | awk '{ if (!h[$0]) { print $0; h[$0]=1 } }'
Это выведет номер ревизии для каждого коммита, который имеет редактирование выбранных вами строк.
Вот шаги:
Первая часть
git rev-list HEAD -- foo.rb
выводит все ревизии, в которых редактируется выбранный файл.Каждая из этих ревизий затем переходит во вторую часть, которая берет каждую и помещает ее в
git blame -l -L 1000,+5 $rev -- foo.rb | cut -d ' ' -f 1
, Это команда из двух частей.git blame -l -L 1000,+5 $rev -- foo.rb
выводит вину за выбранные строки. Предоставляя ему номер ревизии, мы говорим ему начинать с этого коммита и идти оттуда, а не начинать с головы.- Поскольку вина выводит кучу информации, которая нам не нужна,
cut -d ' ' -f 1
дает нам первый столбец (номер ревизии) вывода обвинений.
awk '{ if (!h[$0]) { print $0; h[$0]=1 } }'
удаляет несмежные дубликаты строк, сохраняя порядок, в котором они появились. См. http://jeetworks.org/node/94 для получения дополнительной информации об этой команде.
Вы можете добавить последний шаг здесь, чтобы получить более симпатичный вывод. Труба все в xargs -L 1 git log --oneline -1
и получите соответствующее сообщение коммита для списка ревизий. У меня была странная проблема, связанная с этим последним шагом, когда мне приходилось нажимать следующие несколько выходных ревизий. Я не уверен, почему это было, поэтому я не включил его в свое решение.
Не уверен, что вы хотите сделать, но, возможно, git log -S поможет вам:
-S<string> Look for differences that introduce or remove an instance of <string>. Note that this is different than the string simply appearing in diff output; see the pickaxe entry in gitdiffcore(7) for more details.
Вы можете вставить в строку изменения (или часть изменения), за которыми вы пытаетесь следовать, и в этом списке будут перечислены коммиты, которые когда-либо касались этого изменения.
Пожалуйста, обратитесь к ответу, опубликованному здесь. Перечислите все коммиты для определенного файла. Это именно то, что вам нужно.
Мне понравилась эта головоломка, в ней есть свои тонкости. Источник этого файла, скажем init foo.rb 1000,1005
и следуйте инструкциям. Когда вы закончите, файл @changes
будет иметь правильный список коммитов в топологическом порядке и @blames
будет иметь фактический результат обвинения от каждого.
Это значительно сложнее, чем принятое решение выше. Он производит выходные данные, которые иногда будут более полезными и трудными для воспроизведения, и это было весело для кода.
Проблема с попыткой автоматического отслеживания диапазонов номеров строк при переходе назад в историю заключается в том, что если блок изменений пересекает границы диапазона с номерами строк, вы не можете автоматически определить, где в этом блоке должна быть новая граница диапазона, и у вас также будет включить большой диапазон для больших дополнений и, таким образом, накапливать (иногда множество) не относящихся к делу изменений, или перейти в ручной режим, чтобы убедиться, что это правильно (что, конечно, возвращает вас обратно), или время от времени принимать экстремальные потери.
Если вы хотите, чтобы ваш вывод был точным, используйте ответ выше с надежными диапазонами регулярных выражений, такими как `/^type function(/,/^}/'), или используйте это, что на самом деле не так уж и плохо, пару секунд за шаг назад во время.
В обмен на дополнительную сложность он создает список совпадений в топологической последовательности и, по крайней мере (довольно успешно), пытается уменьшить боль на каждом этапе. Например, он никогда не использует избыточную вину, а диапазоны обновления упрощают настройку номеров строк. И, конечно же, есть надежда того, что мне приходилось по-отдельности смотреть на кусочки...:-P
Чтобы запустить это на полном авто, скажем, { init foo.rb /^class foo/,/^end/; auto; } 2>&-
### functions here create random @-prefix files in the current directory ###
#
# git blame history for a range, finding every change to that range
# throughout the available history. It's somewhat, ahh, "intended for
# customization", is that enough of a warning? It works as advertised
# but drops @-prefix temporary files in your current directory and
# defines new commands
#
# Source this file in a subshell, it defines functions for your use.
# If you have @-prefix files you care about, change all @ in this file
# to something you don't have and source it again.
#
# init path/to/file [<start>,<end>] # range optional
# update-ranges # check range boundaries for the next step
# cycle [<start>,<end>] # range unchanged if not supplied
# prettyblame # pretty colors,
# blue="child commit doesn't have this line"
# green="parent commit doesn't have this line"
# brown=both
# shhh # silence the pre-cycle blurb
#
# For regex ranges, you can _usually_ source this file and say `init
# path/to/file /startpattern/,/endpattern/` and then cycle until it says 0
# commits remain in the checklist
#
# for line-number ranges, or regex ranges you think might be unworthy, you
# need to check and possibly update the range before each cycle. File
# @next is the next blame start-point revision text; and command
# update-ranges will bring up vim with the current range V-selected. If
# that looks good, `@M` is set up to quit even while selecting, so `@M` and
# cycle. If it doesn't look good, 'o' and the arrow keys will make getting
# good line numbers easy, or you can find better regex's. Either way, `@M`
# out and say `cycle <start>,<end>` to update the ranges.
init () {
file=$1;
range="$2"
rm -f @changes
git rev-list --topo-order HEAD -- "$file" \
| tee @checklist \
| cat -n | sort -k2 > @sequence
git blame "-ln${range:+L$range}" -- "$file" > @latest || echo >@checklist
check-cycle
cp @latest @blames
}
update-latest-checklist() {
# update $latest with the latest sha that actually touched our range,
# and delete that and everything later than that from the checklist.
latest=$(
sed s,^^,, @latest \
| sort -uk1,1 \
| join -1 2 -o1.1,1.2 @sequence - \
| sort -unk1,1 \
| sed 1q \
| cut -d" " -f2
)
sed -i 1,/^$latest/d @checklist
}
shhh () { shhh=1; }
check-cycle () {
update-latest-checklist
sed -n q1 @checklist || git log $latest~..$latest --format=%H\ %s | tee -a @changes
next=`sed 1q @checklist`
git cat-file -p `git rev-parse $next:"$file"` > @next
test -z "$shh$shhh$shhhh" && {
echo "A blame from the (next-)most recent alteration (id `git rev-parse --short $latest`) to '$file'"
echo is in file @latest, save its contents where you like
echo
echo you will need to look in file @next to determine the correct next range,
echo and say '`cycle its-start-line,its-end-line`' to continue
echo the "update-ranges" function starts you out with the range selected
} >&2
ncommits=`wc -l @checklist | cut -d\ -f1`
echo $ncommits commits remain in the checklist >&2
return $((ncommits==0))
}
update-ranges () {
start="${range%,*}"
end="${range#*,}"
case "$start" in
*/*) startcmd="1G$start"$'\n' ;;
*) startcmd="${start}G" ;;
esac
case "$end" in
*/*) endcmd="$end"$'\n' ;;
[0-9]*) endcmd="${end}G" ;;
+[0-9]*) endcmd="${end}j" ;;
*) endcmd="echohl Search|echo "can\'t" get to '${end}'\"|echohl None" ;;
esac
vim -c 'set buftype=nofile|let @m=":|q'$'\n"' -c "norm!${startcmd}V${endcmd}z.o" @next
}
cycle () {
sed -n q1 @checklist && { echo "No more commits to check"; return 1; }
range="${1:-$range}"
git blame "-ln${range:+L$range}" $next -- "$file" >@latest || echo >@checklist
echo >>@blames
cat @latest >>@blames
check-cycle
}
auto () {
while cycle; do true; done
}
prettyblames () {
cat >@pretty <<-\EOD
BEGIN {
RS=""
colors[0]="\033[0;30m"
colors[1]="\033[0;34m"
colors[2]="\033[0;32m"
colors[3]="\033[0;33m"
getline commits < "@changes"
split(commits,commit,/\n/)
}
NR!=1 { print "" }
{
thiscommit=gensub(/ .*/,"",1,commit[NR])
printf "%s\n","\033[0;31m"commit[NR]"\033[0m"
split($0,line,/\n/)
for ( n=1; n<=length(line); ++n ) {
color=0
split(line[n],key,/[1-9][0-9]*)/)
if ( NR!=1 && !seen[key[1]] ) color+=1
seen[key[1]]=1;
linecommit = gensub(/ .*/,"",1,line[n])
if (linecommit==thiscommit) color+=2
printf "%s%s\033[0m\n",colors[color],line[n]
}
}
EOD
awk -f @pretty @blames | less -R
}
Несколько мыслей..
Это похоже на этот пост, и похоже, что вы можете подобраться примерно так:
git blame -L '/variable_name *= */',+1
Пока вы знаете определение для сопоставления (для регулярного выражения).
Здесь обсуждается тема использования tig
а также git gui
(который, видимо, мог бы справиться с этим). Я сам еще не пробовал, поэтому не могу проверить это (попробую позже).