Как добавить URL тега в sitemap.xml?

Я работаю на sitemap.xml поколение для проекта Django + Wagtail.

Я реализовал xml поколение для статей путем переопределения get_sitemap_urls метод. Но проблема в том, что генератор карты сайта Wagtail не "видит" URL-адреса тегов блога (не добавляет их в карту сайта).

...
from taggit.models import TaggedItemBase


class BlogPageTag(TaggedItemBase):
    content_object = ParentalKey(
        'BlogInnerPage',
        related_name='tagged_items',
        on_delete=models.CASCADE,
    )

class BlogInnerPage(Page):
    icon = models.ForeignKey(
        'wagtailimages.Image',
        null=True,
        blank=False,
        on_delete=models.SET_NULL,
        related_name='+'
    )
    ...
    post_date = models.DateTimeField(auto_now_add=True, null=True)
    tags = ClusterTaggableManager(through=BlogPageTag, blank=False)

    @property
    def sidebar_tags(self):
        blogs = BlogInnerPage.objects.live().all()
        tags = {}
        for post in blogs:
            for tag in post.tags.all():
                if tag.slug in tags:
                    tags[tag.slug]['count'] += 1
                else:
                    tags[tag.slug] = {
                        'name': tag.name,
                        'count': 1
                    }
        return sorted(tags.items())

    ... 
    def get_sitemap_urls(self):
        return [
            {
                'location': self.full_url,
                'lastmod': self.last_published_at,
                'changefreq': 'weekly',
                'priority': .8
            }
        ]

Я ожидаю увидеть следующий результат для тегов:

<url>
<loc>https://example.com/?tag=design</loc>
<lastmod>2019-01-31T12:24:01+00:00</lastmod>
<priority>0.80</priority>
</url>

Вот что я получил для статей в блоге:

<url>
<loc>
http://example.com/trends-booming-todays-it-industry/
</loc>
<lastmod>2018-10-04</lastmod>
<changefreq>weekly</changefreq>
<priority>0.8</priority>
</url>

1 ответ

Решение

Вы на правильном пути с get_sitemap_urls, Реализация по умолчанию возвращает запись только для самой страницы, потому что она не может знать обо всех параметрах запроса, по которым вы можете фильтровать. Поэтому вы должны добавить эти записи в список.

Предполагая, что у вас есть 2 класса страницы, HomePage и BlogInnerPageзахочешь покинуть BlogInnerPage реализация, как у вас есть и обновить HomePage вернуть свою собственную запись файла Sitemap и добавить записи тега.

from urllib.parse import urlencode

from django.db.models import Max
from taggit.models import Tag
from wagtail.core.models import Page


class HomePage(Page):
    # Note that the method signature should accept an optional request parameter as of Wagtail 2.2
    def get_sitemap_urls(self, request=None):
        urls = super().get_sitemap_urls(request)

        # Get the page's URL, we will use that later.
        base_url = self.get_full_url(request)

        # Get the IDs of all the tags used on your `BlogPage`s.
        tag_ids = BlogPageTag.objects.values_list('tag_id', flat=True).distinct()

        # 1. Filter all the tags with the IDs fetched above.
        # 2. Annotate the query with the latest `last_published_at` of the associated pages.
        #    Note the `home_` part in the string, this needs to be replaced by the name of the Django app your `BlogPageTag` model lives in.
        # 3. Only fetch the slug and lastmod (we don't need the full object).
        tags = Tag.objects\
            .filter(pk__in=tag_ids)\
            .annotate(lastmod=Max('home_blogpagetag_items__content_object__last_published_at'))\
            .values('slug', 'lastmod')

        # Add sitemap entries for each tag.
        for tag in tags:
            urls.append({
                'location': '{}?{}'.format(base_url, urlencode({'tag': tag.slug})),
                'lastmod': tag.lastmod,
            })

        # Return the results.
        return urls
Другие вопросы по тегам