В чем разница между "log" и "symlog"?

В matplotlib я могу установить масштабирование оси, используя pyplot.xscale() или же Axes.set_xscale(), Обе функции принимают три разных масштаба: 'linear' | 'log' | 'symlog',

В чем разница между 'log' а также 'symlog'? В простом тесте, который я сделал, они оба выглядели совершенно одинаково.

Я знаю, что в документации сказано, что они принимают разные параметры, но я до сих пор не понимаю разницу между ними. Может кто-нибудь, пожалуйста, объясните это? Ответ будет лучшим, если в нем есть пример кода и графика! (также: откуда взято название "symlog"?)

2 ответа

Решение

Наконец-то я нашел время для экспериментов, чтобы понять разницу между ними. Вот что я обнаружил:

  • log допускает только положительные значения и позволяет выбирать, как обрабатывать отрицательные значения (mask или же clip).
  • symlog означает симметричный журнал и допускает положительные и отрицательные значения.
  • symlog позволяет установить диапазон около нуля, в пределах графика будет линейный, а не логарифмический.

Я думаю, что все станет намного проще для понимания с помощью графики и примеров, поэтому давайте попробуем их:

import numpy
from matplotlib import pyplot

# Enable interactive mode
pyplot.ion()

# Draw the grid lines
pyplot.grid(True)

# Numbers from -50 to 50, with 0.1 as step
xdomain = numpy.arange(-50,50, 0.1)

# Plots a simple linear function 'f(x) = x'
pyplot.plot(xdomain, xdomain)
# Plots 'sin(x)'
pyplot.plot(xdomain, numpy.sin(xdomain))

# 'linear' is the default mode, so this next line is redundant:
pyplot.xscale('linear')

График с использованием 'линейного' масштабирования

# How to treat negative values?
# 'mask' will treat negative values as invalid
# 'mask' is the default, so the next two lines are equivalent
pyplot.xscale('log')
pyplot.xscale('log', nonposx='mask')

График, использующий масштабирование 'log' и nonposx = 'mask

# 'clip' will map all negative values a very small positive one
pyplot.xscale('log', nonposx='clip')

График, использующий масштабирование 'log' и nonposx = 'clip

# 'symlog' scaling, however, handles negative values nicely
pyplot.xscale('symlog')

График с использованием масштабирования 'symlog

# And you can even set a linear range around zero
pyplot.xscale('symlog', linthreshx=20)

График, использующий масштабирование 'symlog', но линейный в пределах (-20,20

Просто для полноты я использовал следующий код для сохранения каждого рисунка:

# Default dpi is 80
pyplot.savefig('matplotlib_xscale_linear.png', dpi=50, bbox_inches='tight')

Помните, что вы можете изменить размер фигуры, используя:

fig = pyplot.gcf()
fig.set_size_inches([4., 3.])
# Default size: [8., 6.]

(Если вы не уверены, что я отвечу на свой вопрос, прочитайте это)

symlog похож на log, но позволяет вам определить диапазон значений, близких к нулю, в пределах которого график является линейным, чтобы избежать перехода графика в бесконечность вокруг нуля.

От http://matplotlib.sourceforge.net/api/axes_api.html

В лог-графе вы никогда не можете иметь нулевое значение, и если у вас есть значение, которое приближается к нулю, оно будет стремительно падать вниз от вашего графика (бесконечно вниз), потому что когда вы берете "log(приближается к нулю)" получить "приближается к отрицательной бесконечности".

symlog поможет вам в ситуациях, когда вы хотите иметь граф журнала, но когда значение может иногда уменьшаться или приближаться к нулю, но вы все равно хотите иметь возможность показать это на графике осмысленным образом. Если вам нужен symlog, вы бы знали.

Вот пример поведения, когда необходим символический журнал:

Начальный сюжет, без масштабирования. Обратите внимание, сколько точек сгруппировано в x ~0

    ax = sns.scatterplot(x= 'Score', y ='Total Amount Deposited', data = df, hue = 'Predicted Category')

[Без масштабирования'

График в масштабе журнала. Все рухнуло.

    ax = sns.scatterplot(x= 'Score', y ='Total Amount Deposited', data = df, hue = 'Predicted Category')

    ax.set_xscale('log')
    ax.set_yscale('log')
    ax.set(xlabel='Score, log', ylabel='Total Amount Deposited, log')

Шкала журнала'

Почему он рухнул? Поскольку некоторые значения на оси x очень близки или равны 0.

График с масштабированием по симлогу. Все как должно быть.

    ax = sns.scatterplot(x= 'Score', y ='Total Amount Deposited', data = df, hue = 'Predicted Category')

    ax.set_xscale('symlog')
    ax.set_yscale('symlog')
    ax.set(xlabel='Score, symlog', ylabel='Total Amount Deposited, symlog')

Шкала симлогов

Другие вопросы по тегам