Перейти к содержимому

llm.codes

Конвертация JS-документации в Markdown для LLM

llm.codes — это веб-сервис для конвертации JavaScript-heavy документации в чистый Markdown, оптимизированный для языковых моделей.

Сайт: llm.codes Репозиторий: github.com/amantus-ai/llm-codes

Современная документация часто использует:

  • Client-side rendering (React, Vue)
  • Динамическую загрузку контента
  • JavaScript-навигацию

AI-ассистенты (Claude Code, Cursor) не могут выполнять JavaScript и видят пустые страницы.

llm.codes:

  1. Загружает страницы через headless browser (Firecrawl)
  2. Дожидается рендеринга JavaScript
  3. Извлекает основной контент
  4. Конвертирует в чистый Markdown
  5. Удаляет навигацию, рекламу, boilerplate
КатегорияСайты
ЯзыкиPython, TypeScript, Rust, Go, Java, Ruby, PHP, Swift, MDN
WebReact, Vue.js, Angular, Next.js, Nuxt, Svelte, Django, Flask
MobileReact Native, Flutter, Android, Apple Developer
CSSTailwind CSS, Bootstrap, Material-UI, Chakra UI
КатегорияСайты
CloudAWS, Google Cloud, Azure, Vercel, Netlify
DatabasesPostgreSQL, MongoDB, MySQL, Redis, Elasticsearch
DevOpsDocker, Kubernetes, Terraform, GitHub, GitLab
AI/MLPyTorch, TensorFlow, Hugging Face, LangChain

Всего: 69+ сайтов документации

  1. Откройте llm.codes
  2. Вставьте URL документации
  3. Настройте глубину краулинга
  4. Нажмите “Convert”
  5. Скопируйте Markdown
Окно терминала
curl "https://llm.codes/api/scrape" \
-H "Content-Type: application/json" \
-d '{
"url": "https://docs.python.org/3/library/asyncio.html",
"depth": 1
}'
ПараметрОписаниеДиапазон
depthГлубина краулинга0-5
maxUrlsМаксимум страниц1-1000
  • 0 — только указанная страница
  • 1 — страница + прямые ссылки
  • 2 — рекомендуется для большинства случаев
  • 5 — полный раздел документации

llm.codes удаляет:

  • Навигацию и сайдбары
  • Хедеры и футеры
  • Рекламу и баннеры
  • Дублирующийся контент
  • Строки совместимости (iOS 14.0+, etc.)

Сокращение размера до 70% при сохранении всей полезной информации.

  • Результаты кэшируются 30 дней
  • Redis-backed для скорости
  • Повторные запросы мгновенны
Окно терминала
# Получить документацию
curl -s "https://llm.codes/api/scrape?url=https://docs.example.com" \
| claude "Explain how to use this API"
Below is the documentation for the XYZ library:
[paste llm.codes output]
Based on this documentation, help me implement...
ИнструментJS RenderingКраулингФильтрация
llm.codes
curl
wget
llmstxtБазовая
Окно терминала
git clone https://github.com/amantus-ai/llm-codes
cd llm-codes
npm install
npm run dev
Окно терминала
FIRECRAWL_API_KEY=fc-... # Обязательно
UPSTASH_REDIS_URL=... # Опционально (для кэша)

Apple использует тяжёлый JavaScript. llm.codes — единственный способ получить контент для LLM:

https://llm.codes/?url=https://developer.apple.com/documentation/swiftui

Новая React документация (react.dev) также требует JS:

https://llm.codes/?url=https://react.dev/reference/react/hooks
  • Только белый список из 69 сайтов
  • Требуется Firecrawl API key для self-hosting
  • Rate limiting для публичного API
  • Нет поддержки авторизованного контента

llm.codes дополняет стандарт llms.txt:

  1. llms.txt — индекс страниц со ссылками
  2. llm.codes — получение контента конкретных страниц

Workflow:

llms.txt → выбрать нужные URL → llm.codes → получить Markdown