Как клонировать и извлечь все хранилища из Организации?

Я видел несколько реализаций, использующих API github для получения списка библиотек, но в моем случае не уловил их все.

1 ответ

На всякий случай, если кому-то интересно, я написал для этого небольшой bash-файл, надеюсь, это поможет.

Замените XXXXXXXX на название вашей целевой организации

#!/bin/bash
python3 << END

import re
import urllib.request


ORGANIZATION = "XXXXXXXX"
URL_BASE = "https://github.com/{}?page=".format(ORGANIZATION)
URL_CLONE = "https://github.com/{}/{}.git"


page = 1
libraries = True
urls = []
while libraries:
    url = URL_BASE + str(page)
    resp = urllib.request.urlopen(url)
    code = ''
    if resp.code == 200:
        resp_bytes = resp.read()
        code = resp_bytes.decode("utf8")
        resp.close()
    libraries = re.findall('href="/{}/([^"]+)[^>]+codeRepository'.format(ORGANIZATION), code)
    for library in libraries:
        url = URL_CLONE.format(ORGANIZATION, library)
        urls.append(url)
    page += 1


with open('libraries.txt', 'w', encoding='utf-8') as ofile:
    ofile.write('\n'.join(urls))

END

while read i; do
  git clone $i || echo "    Error while cloning, probably already exists"
done <libraries.txt

ls -d */ | xargs -I{} git -C {} pull
Другие вопросы по тегам