Интеграция HTTPX + CaptchaAI (полное руководство)

HTTPX — это современный HTTP-клиент Python с поддержкой асинхронности и HTTP/2.. В этом руководстве показано, как использовать его с CaptchaAI как для синхронного, так и для асинхронного решения CAPTCHA.

Требования

Требование	Подробности
Питон	3.8+
httpx	0.24+
CaptchaAI API-ключ	Получите один здесь

pip install httpx

Синхронный клиент

import httpx
import time
import os


class CaptchaAISync:
    def __init__(self, api_key):
        self.api_key = api_key
        self.base_url = "https://ocr.captchaai.com"
        self.client = httpx.Client(timeout=30)

    def solve(self, params, timeout=300):
        params["key"] = self.api_key

        # Submit
        resp = self.client.get(f"{self.base_url}/in.php", params=params)
        text = resp.text

        if not text.startswith("OK|"):
            raise Exception(f"Submit failed: {text}")

        task_id = text.split("|")[1]

        # Poll
        deadline = time.time() + timeout
        poll_params = {"key": self.api_key, "action": "get", "id": task_id}

        while time.time() < deadline:
            time.sleep(5)
            result = self.client.get(
                f"{self.base_url}/res.php", params=poll_params
            )

            if result.text == "CAPCHA_NOT_READY":
                continue
            if result.text.startswith("OK|"):
                return result.text.split("|", 1)[1]
            raise Exception(f"Solve failed: {result.text}")

        raise TimeoutError(f"Task {task_id} timed out")

    def get_balance(self):
        resp = self.client.get(f"{self.base_url}/res.php", params={
            "key": self.api_key, "action": "getbalance"
        })
        return float(resp.text)

    def close(self):
        self.client.close()


# Usage
solver = CaptchaAISync(os.environ["CAPTCHAAI_API_KEY"])

token = solver.solve({
    "method": "userrecaptcha",
    "googlekey": "6Le-wvkS...",
    "pageurl": "https://example.com",
})
print(f"Token: {token[:50]}...")
solver.close()

Асинхронный клиент

import httpx
import asyncio
import os


class CaptchaAIAsync:
    def __init__(self, api_key):
        self.api_key = api_key
        self.base_url = "https://ocr.captchaai.com"
        self.client = httpx.AsyncClient(timeout=30)

    async def solve(self, params, timeout=300):
        params["key"] = self.api_key

        # Submit
        resp = await self.client.get(
            f"{self.base_url}/in.php", params=params
        )
        text = resp.text

        if not text.startswith("OK|"):
            raise Exception(f"Submit failed: {text}")

        task_id = text.split("|")[1]

        # Poll
        deadline = asyncio.get_event_loop().time() + timeout
        poll_params = {"key": self.api_key, "action": "get", "id": task_id}

        while asyncio.get_event_loop().time() < deadline:
            await asyncio.sleep(5)
            result = await self.client.get(
                f"{self.base_url}/res.php", params=poll_params
            )

            if result.text == "CAPCHA_NOT_READY":
                continue
            if result.text.startswith("OK|"):
                return result.text.split("|", 1)[1]
            raise Exception(f"Solve failed: {result.text}")

        raise TimeoutError(f"Task {task_id} timed out")

    async def get_balance(self):
        resp = await self.client.get(f"{self.base_url}/res.php", params={
            "key": self.api_key, "action": "getbalance"
        })
        return float(resp.text)

    async def close(self):
        await self.client.aclose()


# Usage
async def main():
    solver = CaptchaAIAsync(os.environ["CAPTCHAAI_API_KEY"])

    # Solve multiple concurrently
    tasks = [
        solver.solve({
            "method": "userrecaptcha",
            "googlekey": "6Le-wvkS...",
            "pageurl": f"https://example.com/page{i}",
        })
        for i in range(5)
    ]

    results = await asyncio.gather(*tasks, return_exceptions=True)
    for i, r in enumerate(results):
        if isinstance(r, Exception):
            print(f"Page {i}: FAILED - {r}")
        else:
            print(f"Page {i}: solved ({len(r)} chars)")

    await solver.close()

asyncio.run(main())

Поддержка HTTP/2

HTTPX поддерживает HTTP/2, что снижает накладные расходы на соединение:

pip install httpx[http2]

client = httpx.AsyncClient(http2=True, timeout=30)

HTTP/2 мультиплексирует запросы по одному соединению, повышая производительность при отправке и опросе нескольких CAPTCHA.

Пример парсинга с обработкой CAPTCHA

import httpx
import re
import os

async def scrape_with_captcha(url, solver):
    async with httpx.AsyncClient() as client:
        # Fetch page
        resp = await client.get(url)
        html = resp.text

        # Check for reCAPTCHA
        match = re.search(
            r'data-sitekey=["\']([A-Za-z0-9_-]+)["\']', html
        )
        if not match:
            return html

        site_key = match.group(1)
        token = await solver.solve({
            "method": "userrecaptcha",
            "googlekey": site_key,
            "pageurl": url,
        })

        # Submit form with token
        resp = await client.post(url, data={
            "g-recaptcha-response": token,
        })
        return resp.text


async def main():
    solver = CaptchaAIAsync(os.environ["CAPTCHAAI_API_KEY"])
    content = await scrape_with_captcha("https://example.com", solver)
    print(f"Got {len(content)} chars")
    await solver.close()

asyncio.run(main())

Сравнение: httpx, запросы и aiohttp.

Особенность	httpx (синхронизация)	httpx (асинхронный)	запросы	айоhttp
Асинхронная поддержка	⏳	✅	⏳	✅
HTTP/2	✅	✅	⏳	⏳
Пул соединений	✅	✅	✅	✅
Совместимость API	похожие на запросы	похожие на запросы	—	Другой
подходящий для	Оперативная замена	Современный асинхронный код	Быстрые скрипты	Высокий параллелизм

Часто задаваемые вопросы

Должен ли я использовать httpx для запросов?

Для новых проектов — да. httpx имеет совместимый с запросами API, а также поддержку асинхронности и HTTP/2. Для существующего кода, использующего запросы, миграция проста.

HTTPx быстрее, чем aiohttp?

aiohttp имеет немного меньшие издержки для чисто асинхронных рабочих нагрузок. httpx быстрее для соединений HTTP/2 и более удобен для смешанного кода sync/async.

Могу ли я использовать httpx со Scrapy?

Не напрямую — Scrapy использует цикл событий Twisted. Используйте httpx в автономных скриптах или с асинхронными платформами, такими как FastAPI.

Связанные руководства

aiohttp + CaptchaAI Асинхронный
Axios + CaptchaAI (без браузера)
Руководство по парсингу капч на Python

Интеграция HTTPX + CaptchaAI

Требования

Синхронный клиент

Асинхронный клиент

Поддержка HTTP/2

Пример парсинга с обработкой CAPTCHA

Сравнение: httpx, запросы и aiohttp.

Часто задаваемые вопросы

Должен ли я использовать httpx для запросов?

HTTPx быстрее, чем aiohttp?

Могу ли я использовать httpx со Scrapy?

Связанные руководства

Создание решения CAPTCHA на основе событий с помощью AWS SNS и CaptchaAI

Сравнение подходящий сервисов по решению CAPTCHA (2025 г.)

Учебники Ansible для развертывания рабочих кадров CaptchaAI

Снижение успешности решения CAPTCHA: блок-схема диагностики

Создание клиентской библиотеки Go для API CaptchaAI

Создание пакета PHP Composer для CaptchaAI

Требования

Синхронный клиент

Асинхронный клиент

Поддержка HTTP/2

Пример парсинга с обработкой CAPTCHA

Сравнение: httpx, запросы и aiohttp.

Часто задаваемые вопросы

Должен ли я использовать httpx для запросов?

HTTPx быстрее, чем aiohttp?

Могу ли я использовать httpx со Scrapy?

Связанные руководства

Похожие сообщения

Создание решения CAPTCHA на основе событий с помощью AWS SNS и CaptchaAI

Сравнение подходящий сервисов по решению CAPTCHA (2025 г.)

Учебники Ansible для развертывания рабочих кадров CaptchaAI

Снижение успешности решения CAPTCHA: блок-схема диагностики

Создание клиентской библиотеки Go для API CaptchaAI

Создание пакета PHP Composer для CaptchaAI