Туториалы

Поддержание соединения и HTTP/2 для более быстрых вызовов API CAPTCHA

Каждое решение CAPTCHA включает в себя несколько HTTP-запросов: одну отправку и 3–10 опросов. Без повторного использования соединения каждый запрос оплачивает стоимость нового TCP-квитирования и согласования TLS — 100–300 мс на соединение. В этом руководстве показано, как устранить эти накладные расходы с помощью соединений поддержания активности и мультиплексирования HTTP/2 с помощьюCaptchaAI.

Почему повторное использование соединений имеет значение

Типичное решение reCAPTCHA v2 требует:

  • 1 отправить запрос на in.php
  • 4–6 запросов на опрос в res.php
  • Итого: 5–7 HTTP-запросов.

Без поддержания активности:

  • 5 х (подтверждение TCP ~50 мс + TLS ~100 мс) = накладные расходы 750 мс

С поддержкой:

  • 1 х (TCP + TLS) + 4 х (повторное использование ~5 мс) = накладные расходы 170 мс

Экономия: ~580 мс на одно решение. При 10 000 решений/day это составляет 1,6 часа экономии задержек.

Python: использование запросов.Сессия

Библиотека requests по умолчанию поддерживает поддержку активности при использовании объекта Session:

# keepalive_solver.py
import os
import time
import requests

API_KEY = os.environ.get("CAPTCHAAI_KEY", "YOUR_API_KEY")

# Create a session — reuses TCP connections across requests
session = requests.Session()
session.headers.update({"Connection": "keep-alive"})

def solve_captcha(sitekey, pageurl):
    """Solve reCAPTCHA v2 using a persistent connection."""
    # Submit — uses existing connection if available
    resp = session.get("https://ocr.captchaai.com/in.php", params={
        "key": API_KEY,
        "method": "userrecaptcha",
        "googlekey": sitekey,
        "pageurl": pageurl,
        "json": "1",
    })
    result = resp.json()

    if result.get("status") != 1:
        raise Exception(f"Submit failed: {result.get('request')}")

    task_id = result["request"]

    # Poll — reuses the same connection
    time.sleep(15)
    for _ in range(25):
        poll = session.get("https://ocr.captchaai.com/res.php", params={
            "key": API_KEY,
            "action": "get",
            "id": task_id,
            "json": "1",
        })
        poll_result = poll.json()

        if poll_result.get("status") == 1:
            return poll_result["request"]
        if poll_result.get("request") != "CAPCHA_NOT_READY":
            raise Exception(f"Error: {poll_result.get('request')}")

        time.sleep(5)

    raise Exception("Timeout")

# Solve multiple CAPTCHAs reusing the same connection
for i in range(5):
    token = solve_captcha(
        "6Le-wvkSAAAAAPBMRTvw0Q4Muexq9bi0DJwx_mJ-",
        "https://www.google.com/recaptcha/api2/demo"
    )
    print(f"Solve {i+1}: {token[:30]}...")

Python: HTTP/2 с httpx

Для поддержки HTTP/2 используйте httpx:

# http2_solver.py
import os
import time
import httpx

API_KEY = os.environ.get("CAPTCHAAI_KEY", "YOUR_API_KEY")
BASE_URL = "https://ocr.captchaai.com"

# HTTP/2 client with connection pooling
client = httpx.Client(http2=True, timeout=30.0)

def solve_captcha(sitekey, pageurl):
    """Solve using HTTP/2 multiplexed connections."""
    resp = client.get(f"{BASE_URL}/in.php", params={
        "key": API_KEY,
        "method": "userrecaptcha",
        "googlekey": sitekey,
        "pageurl": pageurl,
        "json": "1",
    })
    result = resp.json()

    if result.get("status") != 1:
        raise Exception(f"Submit failed: {result.get('request')}")

    task_id = result["request"]
    time.sleep(15)

    for _ in range(25):
        poll = client.get(f"{BASE_URL}/res.php", params={
            "key": API_KEY, "action": "get",
            "id": task_id, "json": "1",
        })
        poll_result = poll.json()

        if poll_result.get("status") == 1:
            return poll_result["request"]
        if poll_result.get("request") != "CAPCHA_NOT_READY":
            raise Exception(f"Error: {poll_result.get('request')}")

        time.sleep(5)

    raise Exception("Timeout")

# Multiple solves over a single HTTP/2 connection
for i in range(5):
    token = solve_captcha(
        "6Le-wvkSAAAAAPBMRTvw0Q4Muexq9bi0DJwx_mJ-",
        "https://www.google.com/recaptcha/api2/demo"
    )
    print(f"Solve {i+1}: {token[:30]}...")

client.close()

JavaScript: использование экземпляра Axios с Keep-Alive

// keepalive_solver.js
const axios = require('axios');
const http = require('http');
const https = require('https');

const API_KEY = process.env.CAPTCHAAI_KEY || 'YOUR_API_KEY';

// Create agents with keep-alive enabled
const httpAgent = new http.Agent({ keepAlive: true, maxSockets: 10 });
const httpsAgent = new https.Agent({ keepAlive: true, maxSockets: 10 });

// Axios instance with persistent connections
const api = axios.create({
  baseURL: 'https://ocr.captchaai.com',
  httpAgent,
  httpsAgent,
  timeout: 30000,
});

async function solveCaptcha(sitekey, pageurl) {
  // Submit — reuses connection
  const submit = await api.get('/in.php', {
    params: {
      key: API_KEY, method: 'userrecaptcha',
      googlekey: sitekey, pageurl, json: '1',
    },
  });

  if (submit.data.status !== 1) throw new Error(submit.data.request);
  const taskId = submit.data.request;

  // Poll — reuses same connection
  await new Promise(r => setTimeout(r, 15000));
  for (let i = 0; i < 25; i++) {
    const poll = await api.get('/res.php', {
      params: { key: API_KEY, action: 'get', id: taskId, json: '1' },
    });

    if (poll.data.status === 1) return poll.data.request;
    if (poll.data.request !== 'CAPCHA_NOT_READY') throw new Error(poll.data.request);
    await new Promise(r => setTimeout(r, 5000));
  }
  throw new Error('Timeout');
}

(async () => {
  for (let i = 0; i < 5; i++) {
    const token = await solveCaptcha(
      '6Le-wvkSAAAAAPBMRTvw0Q4Muexq9bi0DJwx_mJ-',
      'https://www.google.com/recaptcha/api2/demo'
    );
    console.log(`Solve ${i + 1}: ${token.slice(0, 30)}...`);
  }

  // Clean up agents
  httpAgent.destroy();
  httpsAgent.destroy();
})();

HTTP/2 против HTTP/1.1 для решения CAPTCHA

Особенность HTTP/1.1 Поддержка активности HTTP/2
Повторное использование соединения Да (последовательный) Да (мультиплексный)
Параллельные потоки 1 на соединение До 100+ за одно соединение
Сжатие заголовка Нет HPACK-сжатие
Уменьшение задержки ~60% ~70%
Требуется поддержка браузера Нет Нет (вызовы API)
подходящий для Последовательные решения Параллельные решения

Для последовательного решения (по одной капче за раз) достаточно поддержки активности HTTP/1.1. Для параллельного решения (несколько CAPTCHA одновременно) мультиплексирование HTTP/2 обеспечивает дополнительные преимущества за счет совместного использования одного соединения.

Определение размера пула соединений

Сопоставьте размер пула с вашим уровнем параллелизма:

Параллельные решения Рекомендуемый размер бассейна
1–5 5 соединений
5–20 10 подключений
20–50 25 подключений
50–100 50 подключений
100+ Использовать HTTP/2 (1 соединение)

Негабаритные пулы тратят память. Пулы недостаточного размера вынуждают создавать новые соединения, сводя на нет преимущества поддержания активности.

Поиск неисправностей

| Проблема | Причина | Исправить |


Следующие шаги

  • CaptchaAI Quickstart: ваше первое решение CAPTCHA за 5 минут
  • Как решить reCAPTCHA v2 через API: пошаговое руководство
  • Как решить Cloudflare Turnstile через API
  • Как решить GeeTest v3 с помощью API
Комментарии для этой статьи отключены.