Python: получение пустого имени хоста с помощью UrlParse
Я использую Python 2.7 и у меня есть Pandas dataframe со столбцом под названием url
, Я пытаюсь извлечь домен следующим образом:
def get_hostname(url):
return urlparse(url).netloc
Когда я примеряю это 'http://www.ocolly.com/news/article'
, Я вернусь:
'www.ocolly.com'
Отлично.
Теперь я пытаюсь:
df['url_hostname'] = df['url'].apply(get_hostname)
Тогда я смотрю на df.head()
и все мои строки имеют пустые url_hostname
колонны. Есть идеи, что я делаю неправильно?
Спасибо!