llm.codes
Конвертация JS-документации в Markdown для LLM
llm.codes — это веб-сервис для конвертации JavaScript-heavy документации в чистый Markdown, оптимизированный для языковых моделей.
Сайт: llm.codes Репозиторий: github.com/amantus-ai/llm-codes
Проблема
Заголовок раздела «Проблема»Современная документация часто использует:
- Client-side rendering (React, Vue)
- Динамическую загрузку контента
- JavaScript-навигацию
AI-ассистенты (Claude Code, Cursor) не могут выполнять JavaScript и видят пустые страницы.
Решение
Заголовок раздела «Решение»llm.codes:
- Загружает страницы через headless browser (Firecrawl)
- Дожидается рендеринга JavaScript
- Извлекает основной контент
- Конвертирует в чистый Markdown
- Удаляет навигацию, рекламу, boilerplate
Поддерживаемые сайты
Заголовок раздела «Поддерживаемые сайты»Языки и фреймворки
Заголовок раздела «Языки и фреймворки»| Категория | Сайты |
|---|---|
| Языки | Python, TypeScript, Rust, Go, Java, Ruby, PHP, Swift, MDN |
| Web | React, Vue.js, Angular, Next.js, Nuxt, Svelte, Django, Flask |
| Mobile | React Native, Flutter, Android, Apple Developer |
| CSS | Tailwind CSS, Bootstrap, Material-UI, Chakra UI |
Платформы
Заголовок раздела «Платформы»| Категория | Сайты |
|---|---|
| Cloud | AWS, Google Cloud, Azure, Vercel, Netlify |
| Databases | PostgreSQL, MongoDB, MySQL, Redis, Elasticsearch |
| DevOps | Docker, Kubernetes, Terraform, GitHub, GitLab |
| AI/ML | PyTorch, TensorFlow, Hugging Face, LangChain |
Всего: 69+ сайтов документации
Использование
Заголовок раздела «Использование»Веб-интерфейс
Заголовок раздела «Веб-интерфейс»- Откройте llm.codes
- Вставьте URL документации
- Настройте глубину краулинга
- Нажмите “Convert”
- Скопируйте Markdown
curl "https://llm.codes/api/scrape" \ -H "Content-Type: application/json" \ -d '{ "url": "https://docs.python.org/3/library/asyncio.html", "depth": 1 }'Параметры
Заголовок раздела «Параметры»| Параметр | Описание | Диапазон |
|---|---|---|
depth | Глубина краулинга | 0-5 |
maxUrls | Максимум страниц | 1-1000 |
Глубина краулинга
Заголовок раздела «Глубина краулинга»- 0 — только указанная страница
- 1 — страница + прямые ссылки
- 2 — рекомендуется для большинства случаев
- 5 — полный раздел документации
Оптимизации
Заголовок раздела «Оптимизации»Фильтрация контента
Заголовок раздела «Фильтрация контента»llm.codes удаляет:
- Навигацию и сайдбары
- Хедеры и футеры
- Рекламу и баннеры
- Дублирующийся контент
- Строки совместимости (iOS 14.0+, etc.)
Результат
Заголовок раздела «Результат»Сокращение размера до 70% при сохранении всей полезной информации.
Кэширование
Заголовок раздела «Кэширование»- Результаты кэшируются 30 дней
- Redis-backed для скорости
- Повторные запросы мгновенны
Интеграция с AI
Заголовок раздела «Интеграция с AI»Claude Code
Заголовок раздела «Claude Code»# Получить документациюcurl -s "https://llm.codes/api/scrape?url=https://docs.example.com" \ | claude "Explain how to use this API"В промптах
Заголовок раздела «В промптах»Below is the documentation for the XYZ library:
[paste llm.codes output]
Based on this documentation, help me implement...Сравнение с другими инструментами
Заголовок раздела «Сравнение с другими инструментами»| Инструмент | JS Rendering | Краулинг | Фильтрация |
|---|---|---|---|
| llm.codes | ✅ | ✅ | ✅ |
| curl | ❌ | ❌ | ❌ |
| wget | ❌ | ✅ | ❌ |
| llmstxt | ❌ | ✅ | Базовая |
Самостоятельный хостинг
Заголовок раздела «Самостоятельный хостинг»git clone https://github.com/amantus-ai/llm-codescd llm-codesnpm installnpm run devПеременные окружения
Заголовок раздела «Переменные окружения»FIRECRAWL_API_KEY=fc-... # ОбязательноUPSTASH_REDIS_URL=... # Опционально (для кэша)Use Cases
Заголовок раздела «Use Cases»Apple Developer Docs
Заголовок раздела «Apple Developer Docs»Apple использует тяжёлый JavaScript. llm.codes — единственный способ получить контент для LLM:
https://llm.codes/?url=https://developer.apple.com/documentation/swiftuiReact документация
Заголовок раздела «React документация»Новая React документация (react.dev) также требует JS:
https://llm.codes/?url=https://react.dev/reference/react/hooksОграничения
Заголовок раздела «Ограничения»- Только белый список из 69 сайтов
- Требуется Firecrawl API key для self-hosting
- Rate limiting для публичного API
- Нет поддержки авторизованного контента
Связь с llms.txt
Заголовок раздела «Связь с llms.txt»llm.codes дополняет стандарт llms.txt:
- llms.txt — индекс страниц со ссылками
- llm.codes — получение контента конкретных страниц
Workflow:
llms.txt → выбрать нужные URL → llm.codes → получить Markdown