Мне нужны некоторые идеи относительно моего алгоритма для счетчика посещений (интервал по группам)
Мой алгоритм предназначен для "счетчика посещений", я пытаюсь не считать одного и того же человека дважды, если этот человек дважды заходил на сайт (например, если он приходит дважды за 5 минут, я хочу считать его 1 хит для этого человека)
Вот как выглядит моя база данных
UserIp UserId Date of user came
127.0.0.1 new.user.akb 26.03.2010 10:15:44
127.0.0.1 new.user.akb 26.03.2010 10:16:44
127.0.0.1 new.user.akb 26.03.2010 10:17:44
127.0.0.1 new.user.akb 26.03.2010 10:18:44
127.0.0.1 new.user.akb 26.03.2010 10:19:44
127.0.0.1 new.user.akb 26.03.2010 10:20:44
127.0.0.1 new.user.akb 26.03.2010 10:21:44
127.0.0.1 new.user.akb 26.03.2010 10:22:44
127.0.0.1 new.user.akb 26.03.2010 10:23:44
Что мне нужно сделать, это получить количество различных пользовательских IP-адресов из таблицы выше, которые произошли в течение определенного промежутка времени. Например, если я установил временной интервал на 5 минут, и скажем, что он начинается в
26.03.2010 10:15:44
Тогда я получу 2 в качестве результата, так как есть 1 отличное значение между 10:15 до 10:20 и 1 другое отличное значение от 10:20 до 10:23,
Например, если мой интервал 3 минуты, то возвращаемый результат будет 3
2 ответа
Здесь есть почти идентичный вопрос: группа по интервалу времени.
Основой этого является то, что вам нужно сгруппировать по временному интервалу, применяя слово к дате и времени, чтобы сгладить интервал.
РЕДАКТИРОВАТЬ
Решил это с помощью группировки:
SET DATEFORMAT dmy;
DECLARE @table TABLE
(
UserIp nvarchar(15),
UserId nvarchar(15),
VisitDate datetime
)
INSERT INTO @table
VALUES ('127.0.0.1', 'new.user.akb', '26.03.2010 10:15:44')
,('127.0.0.1', 'new.user.akb', '26.03.2010 10:16:44')
,('127.0.0.1', 'new.user.akb', '26.03.2010 10:17:44')
,('127.0.0.1', 'new.user.akb', '26.03.2010 10:18:44')
,('127.0.0.1', 'new.user.akb', '26.03.2010 10:19:44')
,('127.0.0.1', 'new.user.akb', '26.03.2010 10:20:44')
,('127.0.0.1', 'new.user.akb', '26.03.2010 10:21:44')
,('127.0.0.1', 'new.user.akb', '26.03.2010 10:22:44')
,('127.0.0.1', 'new.user.akb', '26.03.2010 10:23:44')
SELECT UserIp, UserId, MIN(VisitDate) AS firstVisit
FROM @table
GROUP BY dateadd(mi, (datepart(mi,VisitDate)/5)*5,
dateadd(hh, datediff(hh,0,VisitDate),0)),
UserIp, UserId
Это дает следующий результат (мой формат даты - ymd):
UserIp UserId firstVisit
--------------- --------------- -----------------------
127.0.0.1 new.user.akb 2010-03-26 10:15:44.000
127.0.0.1 new.user.akb 2010-03-26 10:20:44.000
(2 row(s) affected)
Это означает, что вы можете рассчитывать на этот набор результатов для количества посещений за 5 минут.
20000101 - это некоторая начальная дата:
select dateadd(mi, -d, '20000101') as d, num from
(select count(*) num, datediff(mi ,date_field, '20000101') / 5 * 5 d
from your_table
group by datediff(mi, date_field, '20000101') / 5 * 5 ) as a
order by d
А вот решение C# с использованием Linq:
var d1 = new Tuple<string, string, DateTime>("127.0.0.1", "new.user.akb", DateTime.Parse("26.03.2010 10:15:44"));
var d2 = new Tuple<string, string, DateTime>("127.0.0.1", "new.user.akb", DateTime.Parse("26.03.2010 10:16:44"));
var d3 = new Tuple<string, string, DateTime>("127.0.0.1", "new.user.akb", DateTime.Parse("26.03.2010 10:17:44"));
var d4 = new Tuple<string, string, DateTime>("127.0.0.1", "new.user.akb", DateTime.Parse("26.03.2010 10:18:44"));
var d5 = new Tuple<string, string, DateTime>("127.0.0.1", "new.user.akb", DateTime.Parse("26.03.2010 10:19:44"));
var d6 = new Tuple<string, string, DateTime>("127.0.0.1", "new.user.akb", DateTime.Parse("26.03.2010 10:20:44"));
var d7 = new Tuple<string, string, DateTime>("127.0.0.1", "new.user.akb", DateTime.Parse("26.03.2010 10:21:44"));
var d8 = new Tuple<string, string, DateTime>("127.0.0.1", "new.user.akb", DateTime.Parse("26.03.2010 10:22:44"));
var d9 = new Tuple<string, string, DateTime>("127.0.0.1", "new.user.akb", DateTime.Parse("26.03.2010 10:23:44"));
var list = new List<Tuple<string, string, DateTime>> {d1, d2, d3, d4, d5, d6, d7, d8, d9};
int interval = 3;
var query = list.GroupBy(data => ((int) (DateTime.Now - data.Item3).TotalMinutes)/interval*interval)
.Select(data => new {IP = data.First().Item1});
foreach (var entry in query)
{
Console.WriteLine(entry.IP);
}