Для того, что бы уменьшить количество каптч и увеличить скорость сканирования предлагаю
при одном потоке и наличии нескольких источников с списке сканирования во время задержки перескакивать на другой источник. или добавить алгоритм включения более длительных пауз в сканировании по одному источнику и переключение в этот момент на другой.
Также предлагаю при увеличении количества потоков подключать вторым потоком в приоритете второй источник. А то получается, что есть несколько целей для некоторых есть два источника (яндекс и гугл). Если в очереди стоит сначала две задачи по гуглу, второй поток нагрузит опять таки сканирование по гуглу, а это увеличит количество каптч. Если программа будет брать вторым потоком яндекс - это уменьшит нагрузку на один источник.