Синтаксис запуска скрипта

Общий формат команды:

bash

python url_scanner.py [опции] домен глубина

Обязательные аргументы

АргументОписание
домен Домен вашего сайта (например, mysite.ru). Все ссылки, содержащие этот домен, считаются внутренними и не попадают в отчёт.
глубина Целое число — максимальная глубина рекурсивного обхода папок (начиная от корня сканирования). Узнать максимальную глубину папок можно с помощью флага -m.

Опции (необязательные)

Короткий ключДлинный ключПараметрОписаниеПример
-m --max-depth-only нет Только определить максимальную глубину вложенности папок в указанном корне и выйти. python url_scanner.py -m --path /var/www
-s --save нет Сохранить найденные ссылки в JSON-файл (по умолчанию url.json). python url_scanner.py mysite.ru 10 -s
--path ПУТЬ Корневая папка для сканирования. По умолчанию — текущая папка (.). --path /home/user/site
--output ФАЙЛ Имя выходного JSON-файла (работает с -s). По умолчанию url.json. --output result.json
--exclude-dir СПИСОК Исключить папки по имени (перечисляются через пробел). --exclude-dir cache logs tmp
--include-ext СПИСОК Расширения файлов, которые нужно сканировать (перечисляются через пробел). По умолчанию: .php .html .htm .js .css .txt .inc. --include-ext .php .phtml .js
--ignore-file ФАЙЛ Путь к файлу с регулярными выражениями для игнорирования URL (формат JSON, массив строк). По умолчанию ищется urlignore.json в корне сканирования. --ignore-file my_ignore.json
-v --verbose нет Подробный режим — выводить сообщения об ошибках доступа к файлам/папкам. -v
--no-progress нет Отключить отображение прогресс-бара (полезно при перенаправлении вывода в файл). --no-progress
-h --help нет Показать справку и выйти. -h