Каждое решение CAPTCHA включает в себя несколько HTTP-запросов: одну отправку и 3–10 опросов. Без повторного использования соединения каждый запрос оплачивает стоимость нового TCP-квитирования и согласования TLS — 100–300 мс на соединение. В этом руководстве показано, как устранить эти накладные расходы с помощью соединений поддержания активности и мультиплексирования HTTP/2 с помощьюCaptchaAI.
Почему повторное использование соединений имеет значение
Типичное решение reCAPTCHA v2 требует:
- 1 отправить запрос на
in.php - 4–6 запросов на опрос в
res.php - Итого: 5–7 HTTP-запросов.
Без поддержания активности:
- 5 х (подтверждение TCP ~50 мс + TLS ~100 мс) = накладные расходы 750 мс
С поддержкой:
- 1 х (TCP + TLS) + 4 х (повторное использование ~5 мс) = накладные расходы 170 мс
Экономия: ~580 мс на одно решение. При 10 000 решений/day это составляет 1,6 часа экономии задержек.
Python: использование запросов.Сессия
Библиотека requests по умолчанию поддерживает поддержку активности при использовании объекта Session:
# keepalive_solver.py
import os
import time
import requests
API_KEY = os.environ.get("CAPTCHAAI_KEY", "YOUR_API_KEY")
# Create a session — reuses TCP connections across requests
session = requests.Session()
session.headers.update({"Connection": "keep-alive"})
def solve_captcha(sitekey, pageurl):
"""Solve reCAPTCHA v2 using a persistent connection."""
# Submit — uses existing connection if available
resp = session.get("https://ocr.captchaai.com/in.php", params={
"key": API_KEY,
"method": "userrecaptcha",
"googlekey": sitekey,
"pageurl": pageurl,
"json": "1",
})
result = resp.json()
if result.get("status") != 1:
raise Exception(f"Submit failed: {result.get('request')}")
task_id = result["request"]
# Poll — reuses the same connection
time.sleep(15)
for _ in range(25):
poll = session.get("https://ocr.captchaai.com/res.php", params={
"key": API_KEY,
"action": "get",
"id": task_id,
"json": "1",
})
poll_result = poll.json()
if poll_result.get("status") == 1:
return poll_result["request"]
if poll_result.get("request") != "CAPCHA_NOT_READY":
raise Exception(f"Error: {poll_result.get('request')}")
time.sleep(5)
raise Exception("Timeout")
# Solve multiple CAPTCHAs reusing the same connection
for i in range(5):
token = solve_captcha(
"6Le-wvkSAAAAAPBMRTvw0Q4Muexq9bi0DJwx_mJ-",
"https://www.google.com/recaptcha/api2/demo"
)
print(f"Solve {i+1}: {token[:30]}...")
Python: HTTP/2 с httpx
Для поддержки HTTP/2 используйте httpx:
# http2_solver.py
import os
import time
import httpx
API_KEY = os.environ.get("CAPTCHAAI_KEY", "YOUR_API_KEY")
BASE_URL = "https://ocr.captchaai.com"
# HTTP/2 client with connection pooling
client = httpx.Client(http2=True, timeout=30.0)
def solve_captcha(sitekey, pageurl):
"""Solve using HTTP/2 multiplexed connections."""
resp = client.get(f"{BASE_URL}/in.php", params={
"key": API_KEY,
"method": "userrecaptcha",
"googlekey": sitekey,
"pageurl": pageurl,
"json": "1",
})
result = resp.json()
if result.get("status") != 1:
raise Exception(f"Submit failed: {result.get('request')}")
task_id = result["request"]
time.sleep(15)
for _ in range(25):
poll = client.get(f"{BASE_URL}/res.php", params={
"key": API_KEY, "action": "get",
"id": task_id, "json": "1",
})
poll_result = poll.json()
if poll_result.get("status") == 1:
return poll_result["request"]
if poll_result.get("request") != "CAPCHA_NOT_READY":
raise Exception(f"Error: {poll_result.get('request')}")
time.sleep(5)
raise Exception("Timeout")
# Multiple solves over a single HTTP/2 connection
for i in range(5):
token = solve_captcha(
"6Le-wvkSAAAAAPBMRTvw0Q4Muexq9bi0DJwx_mJ-",
"https://www.google.com/recaptcha/api2/demo"
)
print(f"Solve {i+1}: {token[:30]}...")
client.close()
JavaScript: использование экземпляра Axios с Keep-Alive
// keepalive_solver.js
const axios = require('axios');
const http = require('http');
const https = require('https');
const API_KEY = process.env.CAPTCHAAI_KEY || 'YOUR_API_KEY';
// Create agents with keep-alive enabled
const httpAgent = new http.Agent({ keepAlive: true, maxSockets: 10 });
const httpsAgent = new https.Agent({ keepAlive: true, maxSockets: 10 });
// Axios instance with persistent connections
const api = axios.create({
baseURL: 'https://ocr.captchaai.com',
httpAgent,
httpsAgent,
timeout: 30000,
});
async function solveCaptcha(sitekey, pageurl) {
// Submit — reuses connection
const submit = await api.get('/in.php', {
params: {
key: API_KEY, method: 'userrecaptcha',
googlekey: sitekey, pageurl, json: '1',
},
});
if (submit.data.status !== 1) throw new Error(submit.data.request);
const taskId = submit.data.request;
// Poll — reuses same connection
await new Promise(r => setTimeout(r, 15000));
for (let i = 0; i < 25; i++) {
const poll = await api.get('/res.php', {
params: { key: API_KEY, action: 'get', id: taskId, json: '1' },
});
if (poll.data.status === 1) return poll.data.request;
if (poll.data.request !== 'CAPCHA_NOT_READY') throw new Error(poll.data.request);
await new Promise(r => setTimeout(r, 5000));
}
throw new Error('Timeout');
}
(async () => {
for (let i = 0; i < 5; i++) {
const token = await solveCaptcha(
'6Le-wvkSAAAAAPBMRTvw0Q4Muexq9bi0DJwx_mJ-',
'https://www.google.com/recaptcha/api2/demo'
);
console.log(`Solve ${i + 1}: ${token.slice(0, 30)}...`);
}
// Clean up agents
httpAgent.destroy();
httpsAgent.destroy();
})();
HTTP/2 против HTTP/1.1 для решения CAPTCHA
| Особенность | HTTP/1.1 Поддержка активности | HTTP/2 |
|---|---|---|
| Повторное использование соединения | Да (последовательный) | Да (мультиплексный) |
| Параллельные потоки | 1 на соединение | До 100+ за одно соединение |
| Сжатие заголовка | Нет | HPACK-сжатие |
| Уменьшение задержки | ~60% | ~70% |
| Требуется поддержка браузера | Нет | Нет (вызовы API) |
| подходящий для | Последовательные решения | Параллельные решения |
Для последовательного решения (по одной капче за раз) достаточно поддержки активности HTTP/1.1. Для параллельного решения (несколько CAPTCHA одновременно) мультиплексирование HTTP/2 обеспечивает дополнительные преимущества за счет совместного использования одного соединения.
Определение размера пула соединений
Сопоставьте размер пула с вашим уровнем параллелизма:
| Параллельные решения | Рекомендуемый размер бассейна |
|---|---|
| 1–5 | 5 соединений |
| 5–20 | 10 подключений |
| 20–50 | 25 подключений |
| 50–100 | 50 подключений |
| 100+ | Использовать HTTP/2 (1 соединение) |
Негабаритные пулы тратят память. Пулы недостаточного размера вынуждают создавать новые соединения, сводя на нет преимущества поддержания активности.
Поиск неисправностей
| Проблема | Причина | Исправить |
Следующие шаги
- CaptchaAI Quickstart: ваше первое решение CAPTCHA за 5 минут
- Как решить reCAPTCHA v2 через API: пошаговое руководство
- Как решить Cloudflare Turnstile через API
- Как решить GeeTest v3 с помощью API