DevOps & Scaling

AWS Lambda + CaptchaAI: бессерверное решение CAPTCHA

AWS Lambda решает CAPTCHA без управления серверами. Платите только за решение, автоматическое масштабирование и интеграцию с API Gateway, SQS или Step Functions.


Лямбда-обработчик

# lambda_function.py
import json
import os
import time
import urllib.request
import urllib.parse


def lambda_handler(event, context):
    """AWS Lambda handler for CaptchaAI solving."""
    api_key = os.environ["CAPTCHAAI_KEY"]

    # Parse input
    body = json.loads(event.get("body", "{}")) if isinstance(event.get("body"), str) else event

    method = body.get("method", "userrecaptcha")
    params = body.get("params", {})

    try:
        token = solve_captcha(api_key, method, params)
        return {
            "statusCode": 200,
            "body": json.dumps({"token": token}),
        }
    except Exception as e:
        return {
            "statusCode": 500,
            "body": json.dumps({"error": str(e)}),
        }


def solve_captcha(api_key, method, params, timeout=90):
    """Solve CAPTCHA using CaptchaAI API."""
    # Submit task
    submit_data = urllib.parse.urlencode({
        "key": api_key,
        "method": method,
        "json": 1,
        **params,
    }).encode()

    req = urllib.request.Request(
        "https://ocr.captchaai.com/in.php",
        data=submit_data,
    )
    with urllib.request.urlopen(req, timeout=30) as resp:
        result = json.loads(resp.read())

    if result.get("status") != 1:
        raise RuntimeError(f"Submit error: {result.get('request')}")

    task_id = result["request"]

    # Poll for result
    start = time.time()
    while time.time() - start < timeout:
        time.sleep(5)
        poll_url = (
            f"https://ocr.captchaai.com/res.php"
            f"?key={api_key}&action=get&id={task_id}&json=1"
        )
        with urllib.request.urlopen(poll_url, timeout=15) as resp:
            data = json.loads(resp.read())

        if data["request"] != "CAPCHA_NOT_READY":
            if data.get("status") == 1:
                return data["request"]
            raise RuntimeError(f"Solve error: {data['request']}")

    raise TimeoutError("Solve timeout")

Безопасный ключ API с помощью Secrets Manager

import json
import boto3


def get_api_key():
    """Retrieve CaptchaAI key from AWS Secrets Manager."""
    client = boto3.client("secretsmanager")
    response = client.get_secret_value(SecretId="captchaai/api-key")
    secret = json.loads(response["SecretString"])
    return secret["api_key"]

Храните секрет:

aws secretsmanager create-secret \
  --name captchaai/api-key \
  --secret-string '{"api_key":"YOUR_API_KEY"}'

Шаблон SAM (инфраструктура как код)

# template.yaml
AWSTemplateFormatVersion: "2010-09-09"
Transform: AWS::Serverless-2016-10-31

Globals:
  Function:
    Timeout: 120
    MemorySize: 256
    Runtime: python3.11

Resources:
  CaptchaSolverFunction:
    Type: AWS::Serverless::Function
    Properties:
      Handler: lambda_function.lambda_handler
      Environment:
        Variables:
          CAPTCHAAI_KEY: !Sub "{{resolve:secretsmanager:captchaai/api-key:SecretString:api_key}}"
      Events:
        SolveApi:
          Type: Api
          Properties:
            Path: /solve
            Method: post
      Policies:

        - AWSSecretsManagerGetSecretValuePolicy:
            SecretArn: !Sub "arn:aws:secretsmanager:${AWS::Region}:${AWS::AccountId}:secret:captchaai/api-key-*"

Outputs:
  SolveApiUrl:
    Value: !Sub "https://${ServerlessRestApi}.execute-api.${AWS::Region}.amazonaws.com/Prod/solve"

Развертывать

# Build and deploy
sam build
sam deploy --guided

# Test
curl -X POST https://YOUR_API_ID.execute-api.us-east-1.amazonaws.com/Prod/solve \
  -H "Content-Type: application/json" \
  -d '{
    "method": "userrecaptcha",
    "params": {
      "googlekey": "SITE_KEY",
      "pageurl": "https://example.com"
    }
  }'

Пакетная обработка, запускаемая SQS

Обработка задач CAPTCHA из очереди SQS:

import json
import os
import time
import urllib.request
import urllib.parse


def sqs_handler(event, context):
    """Process CAPTCHA tasks from SQS queue."""
    api_key = os.environ["CAPTCHAAI_KEY"]
    results = []

    for record in event["Records"]:
        task = json.loads(record["body"])
        try:
            token = solve_captcha(
                api_key,
                task["method"],
                task["params"],
            )
            results.append({
                "task_id": task.get("id"),
                "status": "success",
                "token": token[:50],
            })
        except Exception as e:
            results.append({
                "task_id": task.get("id"),
                "status": "error",
                "error": str(e),
            })

    return {"results": results}

Лямбда-соображения

Фактор Ценить
Максимальное время ожидания 15 минут (для большинства CAPTCHA установлено значение 2 минуты)
Память Достаточно 256 МБ (без тяжелой обработки)
Параллелизм По умолчанию 1000 одновременно (при необходимости запросите увеличение)
Холодный старт ~500 мс для Python (незначительно по сравнению со временем решения)
Расходы ~$0,0001 за решение (только вычисления)
Зависимости Используйте urllib (встроенный), чтобы избежать слоев Lambda.

Поиск неисправностей

Проблема Причина Исправить
Время ожидания функции истекло Тайм-аут лямбды <время решения Установите тайм-аут на 120 с+.
Разрешение отклонено по секрету Отсутствует политика IAM Добавить политику чтения SecretsManager
Холодный старт увеличивает задержку Редкие вызовы Использовать подготовленный параллелизм
Ошибка импорта запросов Не входит в комплект Lambda Используйте urllib.request (встроенный) или добавьте слой.

Часто задаваемые вопросы

Эффективна ли Lambda для решения CAPTCHA?

Да. При цене ~0,0001 доллара США за вызов (256 МБ, 60 с) Lambda добавляет незначительную стоимость к плате за API CaptchaAI. Вы избегаете затрат сервера во время простоя.

А как насчет 15-минутного тайм-аута Лямбды?

Большинство CAPTCHA решаются за 10–60 секунд. Установите тайм-аут Lambda на 120 секунд. Для сложных типов, таких как reCAPTCHA Enterprise, используйте 180 секунд.

Могу ли я использовать слои Lambda для библиотеки запросов?

Да, но urllib.request (встроенный) отлично работает с простым HTTP API CaptchaAI. Это позволяет полностью избежать управления слоями.


Связанные руководства

  • Облачные функции Google + CaptchaAI
  • Функции Azure + CaptchaAI

Перейдите на бессерверный режим —получите ключ CaptchaAIсегодня.

Комментарии для этой статьи отключены.

Похожие сообщения

DevOps & Scaling Создание решения CAPTCHA на основе событий с помощью AWS SNS и CaptchaAI
Руководство Dev Ops по созданию решений CAPTCHA на основе событий с помощью AWS SNS и Captcha AI, с архитектурными решениями, эксплуатационными соображениями и...

Руководство Dev Ops по созданию решений CAPTCHA на основе событий с помощью AWS SNS и Captcha AI, с архитектур...

Apr 24, 2026
DevOps & Scaling Учебники Ansible для развертывания рабочих кадров CaptchaAI
Руководство по Dev Ops для Учебники Ansible для развертывания рабочих кадров Captcha AI, с архитектурными решениями, соображениями по эксплуатации и шаблонами а...

Руководство по Dev Ops для Учебники Ansible для развертывания рабочих кадров Captcha AI, с архитектурными реше...

Apr 22, 2026
Tutorials Создание очереди решения CAPTCHA на Python с помощью CaptchaAI
Пошаговое руководство по созданию очереди решений CAPTCHA на Python с помощью Captcha AI, с примерами многократного использования и понятным рабочим процессом C...

Пошаговое руководство по созданию очереди решений CAPTCHA на Python с помощью Captcha AI, с примерами многокра...

Apr 30, 2026