Синтаксис запуска скрипта
Общий формат команды:
bash
python url_scanner.py [опции] домен глубина
Обязательные аргументы
| Аргумент | Описание |
|---|---|
домен | Домен вашего сайта (например, mysite.ru). Все ссылки, содержащие этот домен, считаются внутренними и не попадают в отчёт. |
глубина | Целое число — максимальная глубина рекурсивного обхода папок (начиная от корня сканирования). Узнать максимальную глубину папок можно с помощью флага -m. |
Опции (необязательные)
| Короткий ключ | Длинный ключ | Параметр | Описание | Пример |
|---|---|---|---|---|
-m | --max-depth-only | нет | Только определить максимальную глубину вложенности папок в указанном корне и выйти. | python url_scanner.py -m --path /var/www |
-s | --save | нет | Сохранить найденные ссылки в JSON-файл (по умолчанию url.json). | python url_scanner.py mysite.ru 10 -s |
--path | ПУТЬ | Корневая папка для сканирования. По умолчанию — текущая папка (.). | --path /home/user/site | |
--output | ФАЙЛ | Имя выходного JSON-файла (работает с -s). По умолчанию url.json. | --output result.json | |
--exclude-dir | СПИСОК | Исключить папки по имени (перечисляются через пробел). | --exclude-dir cache logs tmp | |
--include-ext | СПИСОК | Расширения файлов, которые нужно сканировать (перечисляются через пробел). По умолчанию: .php .html .htm .js .css .txt .inc. | --include-ext .php .phtml .js | |
--ignore-file | ФАЙЛ | Путь к файлу с регулярными выражениями для игнорирования URL (формат JSON, массив строк). По умолчанию ищется urlignore.json в корне сканирования. | --ignore-file my_ignore.json | |
-v | --verbose | нет | Подробный режим — выводить сообщения об ошибках доступа к файлам/папкам. | -v |
--no-progress | нет | Отключить отображение прогресс-бара (полезно при перенаправлении вывода в файл). | --no-progress | |
-h | --help | нет | Показать справку и выйти. | -h |