Как добавить URL тега в sitemap.xml?
Я работаю на sitemap.xml
поколение для проекта Django + Wagtail.
Я реализовал xml
поколение для статей путем переопределения get_sitemap_urls
метод. Но проблема в том, что генератор карты сайта Wagtail не "видит" URL-адреса тегов блога (не добавляет их в карту сайта).
...
from taggit.models import TaggedItemBase
class BlogPageTag(TaggedItemBase):
content_object = ParentalKey(
'BlogInnerPage',
related_name='tagged_items',
on_delete=models.CASCADE,
)
class BlogInnerPage(Page):
icon = models.ForeignKey(
'wagtailimages.Image',
null=True,
blank=False,
on_delete=models.SET_NULL,
related_name='+'
)
...
post_date = models.DateTimeField(auto_now_add=True, null=True)
tags = ClusterTaggableManager(through=BlogPageTag, blank=False)
@property
def sidebar_tags(self):
blogs = BlogInnerPage.objects.live().all()
tags = {}
for post in blogs:
for tag in post.tags.all():
if tag.slug in tags:
tags[tag.slug]['count'] += 1
else:
tags[tag.slug] = {
'name': tag.name,
'count': 1
}
return sorted(tags.items())
...
def get_sitemap_urls(self):
return [
{
'location': self.full_url,
'lastmod': self.last_published_at,
'changefreq': 'weekly',
'priority': .8
}
]
Я ожидаю увидеть следующий результат для тегов:
<url>
<loc>https://example.com/?tag=design</loc>
<lastmod>2019-01-31T12:24:01+00:00</lastmod>
<priority>0.80</priority>
</url>
Вот что я получил для статей в блоге:
<url>
<loc>
http://example.com/trends-booming-todays-it-industry/
</loc>
<lastmod>2018-10-04</lastmod>
<changefreq>weekly</changefreq>
<priority>0.8</priority>
</url>
1 ответ
Вы на правильном пути с get_sitemap_urls
, Реализация по умолчанию возвращает запись только для самой страницы, потому что она не может знать обо всех параметрах запроса, по которым вы можете фильтровать. Поэтому вы должны добавить эти записи в список.
Предполагая, что у вас есть 2 класса страницы, HomePage
и BlogInnerPage
захочешь покинуть BlogInnerPage
реализация, как у вас есть и обновить HomePage
вернуть свою собственную запись файла Sitemap и добавить записи тега.
from urllib.parse import urlencode
from django.db.models import Max
from taggit.models import Tag
from wagtail.core.models import Page
class HomePage(Page):
# Note that the method signature should accept an optional request parameter as of Wagtail 2.2
def get_sitemap_urls(self, request=None):
urls = super().get_sitemap_urls(request)
# Get the page's URL, we will use that later.
base_url = self.get_full_url(request)
# Get the IDs of all the tags used on your `BlogPage`s.
tag_ids = BlogPageTag.objects.values_list('tag_id', flat=True).distinct()
# 1. Filter all the tags with the IDs fetched above.
# 2. Annotate the query with the latest `last_published_at` of the associated pages.
# Note the `home_` part in the string, this needs to be replaced by the name of the Django app your `BlogPageTag` model lives in.
# 3. Only fetch the slug and lastmod (we don't need the full object).
tags = Tag.objects\
.filter(pk__in=tag_ids)\
.annotate(lastmod=Max('home_blogpagetag_items__content_object__last_published_at'))\
.values('slug', 'lastmod')
# Add sitemap entries for each tag.
for tag in tags:
urls.append({
'location': '{}?{}'.format(base_url, urlencode({'tag': tag.slug})),
'lastmod': tag.lastmod,
})
# Return the results.
return urls