python: использование наборов данных для увеличения скорости кодирования
Я использовал функцию Стиана, чтобы вычеркнуть все URL-адреса со страницы YouTube, но теперь мне нужна помощь.
Я написал следующий код, который получает дату публикации, заголовок, рейтинг, количество просмотров, продолжительность, количество лайков и URL для каждого видео.
results = []
for url in video_urls:
test = pafy.new(url)
result = test.published, test.title, test.rating, test.viewcount,
test.duration, test.likes, url
results.append(result)
df = pd.DataFrame(results, columns = ["Date", "Title", "Rating", "View Count", "Duration", "Likes", "URL"])
Проблема в том, что цикл for занимает почти шесть минут, а на этом канале всего 100 видео.
С этой целью, как я могу достичь своей цели более эффективно? Должен ли я попытаться создать наборы данных для каждой из переменных и затем объединить их в один фрейм данных, или есть более эффективный процесс, о котором я не думаю?