Размышлизмы eao197: [prog.c++] Насколько дорого дергать раз в секунду некий метод у целой кучи объектов?

суббота, 30 мая 2020 г.

[prog.c++] Насколько дорого дергать раз в секунду некий метод у целой кучи объектов?

Нужно спроектировать решение задачи, в которой есть N рабочих нитей и на каждой из них нужно обрабатывать тысячи параллельных активностей. В том числе у этих активностей нужно контролировать итечение тех или иных тайм-аутов.

Скорее всего каждая активность будет реализована неким объектом (внутри которого будет какой-то конечный автомат, а снаружи каждый объект будет иметь некий общий интерфейс).

И вот пока не приходит в голову ничего лучшего, чем на каждой рабочей нити просто раз в секунду бежать по списку объектов-активностей и дергать у каждого из них специальный метод. В этом методе объект-активность уже и будет проверять истечение тайм-аутов.

Смущало то, что раз в секунду придется дергать метод у тысяч объектов. С перспективой делать это для десятков тысяч объектов. Соответственно, прежде чем принимать такое проектное решение, захотелось узнать, а какова будет примерная стоимость подобного способа.

Для оценки была сделана небольшая программа, в которой создается несколько рабочих нитей, на каждой из которых создается множество объектов handler-ов, а затем с темпом ~1s у этих handler-ов вызывается метод on_next_turn.

Реализация on_next_turn у handler-ов не совсем пустая. А что-то типа вот такого:

void
actual_handler_one_t::on_next_turn( trigger_t & trigger )
{
   const auto now = std::chrono::steady_clock::now();
   if( now > m_border )
   {
      trigger.triggered();
      m_border = now + m_step;
   }
}

Т.е. в каждом вызове on_next_turn вызывается еще и метод now из steady_clock.

Так же в этом тесте я постарался сделать так, чтобы компилятор не повыбрасывал код, который компилятору мог бы показаться неимеющим наблюдаемых эффектов. Поэтому интерфейсы и реализации объектов handler-ов были разнесены по разным файлам, сделана пара разных реализаций handler-ов (в каждой из которых дергается steady_clock::now()), введен абстрактный тип trigger_t, у которого handler-ы время от времени вызывают triggered. Что позволяет думать, что проведенный замер таки показывает именно то, что мне нужно.

А показывает он вот что: на i7-6600U с Kubuntu 18.04 и GCC-8.4 при запуске с тремя рабочими нитями и 50K объектами handler-ами на каждой из рабочих нитей, среднее время цикла вызова on_next_turn для всех 50K handler-ов составляет 7-8ms. Худшие из увиденных результатов -- 10ms.

При этом 50K объектов -- это где-то раза в 3 больше, чем нужно на данный момент.

Так что пока все выглядит так, что вариант раз в секунду бежать по списку объектов-активностей и вызывать у них метод для обработки тайм-аутов, вполне себе имеет право на жизнь.

8 комментариев:

Stas Mischenko комментирует...: Если нужно запускать что-нибудь по истечении таймаута, то я предпочитаю для этого использовать одну нить, которая по истечению таймаута отправляет очередной таск в threadpool, затем ждёт следующий таймаут и так далее. Иными словами это scheduler + threadpool. Таким образом код становится "чище", потому что логика по отслеживанию таймаутов в одном месте, да и нити из threadpool-а не заняты их проверкой.; 1 июня 2020 г. в 12:12
eao197 комментирует...: Пост про другое. В переложении на ваш пример -- это попытка оценить стоимость выполнения одного большого таска, который вы по таймеру запостили на threadpool; 1 июня 2020 г. в 12:28
Unknown комментирует...: Почему бы не использовать отдельную очередь под таймауты? Задоно вместо списка можно выбрать чтото более подходящее, например priority_queue; 16 июня 2020 г. в 08:32
eao197 комментирует...: Очередь ведь так же будет иметь накладные расходы. Когда 50K объектов на одной нити начнут вставлять/изымать объекты-таймеры в эту очередь, то это так же будет отнимать время и ресурсы.

Так что тут нужно проводить дополнительные эксперименты и сравнения. А в посте показаны результаты самого тривиального варианта. И результаты эти, как по мне, весьма дешевые.; 16 июня 2020 г. в 08:44
Unknown комментирует...: Ну если примерно каждый воркер хоть раз да и оставит какую-нибудь таску то да... Но обычно бывает так, что 99% воркеров полностью пассивны, и только 1 процент хоть чтото делает.
Я тоже пару раз напорывался на "а давай оставлю здесь линейный алгоритм". Не понравилось. Больше не буду; 16 июня 2020 г. в 17:08
eao197 комментирует...: Так задача как раз и появилась потому, что каждому воркеру таймер и нужен. Так что при создании воркера, как минимум, одна заявка будет ставится. И при уничтожении, скорее всего, заявка должна будет изыматься (т.к. для 99% воркеров время жизни истечет до прихода
этой таймерной заявки). Поэтому и возникло желание посмотреть, а что будет, если тупо раз в секунду вызывать некий on_timer у всех живых воркеров.; 16 июня 2020 г. в 17:19
sv комментирует...: Ну тогда я если честно не понимаю акцентов. Если почти на каждый вызов происходит какая-то работа, то смысла мерять время вызова не вижу, почти наверняка сама работа "отъест" много больше времени. Но если Вы меряете время вызова пустого метода, значит переживаете об этом, и тогда лучшее решение - не вызывать методы попусту; 16 июня 2020 г. в 17:37
eao197 комментирует...: Суть в том, что реализация отдельных таймеров для воркеров -- это работа. В смысле программерская работа. Которую нужно сделать, отладить, хоть как-то откомментировать.

Понятное дело, что лишнюю работу делать не хочется. Поэтому я проверил стоимость самого "ленивого" варианта: простой цикл с вызовом on_timer вместо прикручивания какого-то timer-queue.

Если бы такой "ленивый" вариант показал расходы на уровне сотни миллисекунд, то нужно было бы экспериментировать с различными таймерными механизмами (будь то timer-heap на базе priority-queue или более простой timer-list). Но расходы оказались достаточно малыми, чтобы пока не заморачиваться и перейти к решению других насущных проблем.

Ну а работа, в принципе, имитируется более-менее реальная. В on_timer нужно взять текущее время и проверить, а не истекло ли время жизни воркера.; 16 июня 2020 г. в 17:50

Отправить комментарий

Размышлизмы eao197

суббота, 30 мая 2020 г.

[prog.c++] Насколько дорого дергать раз в секунду некий метод у целой кучи объектов?

8 комментариев:

Подписаться

Архив блога

LinkedIn Share

Статистика Google

Размышлизмы eao197

суббота, 30 мая 2020 г.

[prog.c++] Насколько дорого дергать раз в секунду некий метод у целой кучи объектов?

8 комментариев:

Подписаться

Архив блога

LinkedIn Share

Статистика Google

суббота, 30 мая 2020 г.