В чем разница между "log" и "symlog"?
В matplotlib я могу установить масштабирование оси, используя pyplot.xscale()
или же Axes.set_xscale()
, Обе функции принимают три разных масштаба: 'linear'
| 'log'
| 'symlog'
,
В чем разница между 'log'
а также 'symlog'
? В простом тесте, который я сделал, они оба выглядели совершенно одинаково.
Я знаю, что в документации сказано, что они принимают разные параметры, но я до сих пор не понимаю разницу между ними. Может кто-нибудь, пожалуйста, объясните это? Ответ будет лучшим, если в нем есть пример кода и графика! (также: откуда взято название "symlog"?)
2 ответа
Наконец-то я нашел время для экспериментов, чтобы понять разницу между ними. Вот что я обнаружил:
log
допускает только положительные значения и позволяет выбирать, как обрабатывать отрицательные значения (mask
или жеclip
).symlog
означает симметричный журнал и допускает положительные и отрицательные значения.symlog
позволяет установить диапазон около нуля, в пределах графика будет линейный, а не логарифмический.
Я думаю, что все станет намного проще для понимания с помощью графики и примеров, поэтому давайте попробуем их:
import numpy
from matplotlib import pyplot
# Enable interactive mode
pyplot.ion()
# Draw the grid lines
pyplot.grid(True)
# Numbers from -50 to 50, with 0.1 as step
xdomain = numpy.arange(-50,50, 0.1)
# Plots a simple linear function 'f(x) = x'
pyplot.plot(xdomain, xdomain)
# Plots 'sin(x)'
pyplot.plot(xdomain, numpy.sin(xdomain))
# 'linear' is the default mode, so this next line is redundant:
pyplot.xscale('linear')
# How to treat negative values?
# 'mask' will treat negative values as invalid
# 'mask' is the default, so the next two lines are equivalent
pyplot.xscale('log')
pyplot.xscale('log', nonposx='mask')
# 'clip' will map all negative values a very small positive one
pyplot.xscale('log', nonposx='clip')
# 'symlog' scaling, however, handles negative values nicely
pyplot.xscale('symlog')
# And you can even set a linear range around zero
pyplot.xscale('symlog', linthreshx=20)
Просто для полноты я использовал следующий код для сохранения каждого рисунка:
# Default dpi is 80
pyplot.savefig('matplotlib_xscale_linear.png', dpi=50, bbox_inches='tight')
Помните, что вы можете изменить размер фигуры, используя:
fig = pyplot.gcf()
fig.set_size_inches([4., 3.])
# Default size: [8., 6.]
(Если вы не уверены, что я отвечу на свой вопрос, прочитайте это)
symlog похож на log, но позволяет вам определить диапазон значений, близких к нулю, в пределах которого график является линейным, чтобы избежать перехода графика в бесконечность вокруг нуля.
От http://matplotlib.sourceforge.net/api/axes_api.html
В лог-графе вы никогда не можете иметь нулевое значение, и если у вас есть значение, которое приближается к нулю, оно будет стремительно падать вниз от вашего графика (бесконечно вниз), потому что когда вы берете "log(приближается к нулю)" получить "приближается к отрицательной бесконечности".
symlog поможет вам в ситуациях, когда вы хотите иметь граф журнала, но когда значение может иногда уменьшаться или приближаться к нулю, но вы все равно хотите иметь возможность показать это на графике осмысленным образом. Если вам нужен symlog, вы бы знали.
Вот пример поведения, когда необходим символический журнал:
Начальный сюжет, без масштабирования. Обратите внимание, сколько точек сгруппировано в x ~0
ax = sns.scatterplot(x= 'Score', y ='Total Amount Deposited', data = df, hue = 'Predicted Category')
['
График в масштабе журнала. Все рухнуло.
ax = sns.scatterplot(x= 'Score', y ='Total Amount Deposited', data = df, hue = 'Predicted Category')
ax.set_xscale('log')
ax.set_yscale('log')
ax.set(xlabel='Score, log', ylabel='Total Amount Deposited, log')
'
Почему он рухнул? Поскольку некоторые значения на оси x очень близки или равны 0.
График с масштабированием по симлогу. Все как должно быть.
ax = sns.scatterplot(x= 'Score', y ='Total Amount Deposited', data = df, hue = 'Predicted Category')
ax.set_xscale('symlog')
ax.set_yscale('symlog')
ax.set(xlabel='Score, symlog', ylabel='Total Amount Deposited, symlog')