.claude/skills/web-scraper/SKILL.md
Crawl website và trích xuất dữ liệu có cấu trúc bằng BeautifulSoup, Scrapy, Playwright. Hỗ trợ cả trang tĩnh và trang động (JS-rendered). Kích hoạt khi user cần lấy dữ liệu từ website bất kỳ.
npx skillsauth add nguynbon03/API-XuongMedia-Backup web-scraperInstall this skill globally with one command. Works with Claude Code, Cursor, and Windsurf.
3 of 9 scanners reported clean
Some scanners were skipped, did not run, or reported a non-clean status. Review each row below.
Lấy dữ liệu có cấu trúc từ bất kỳ website nào.
| Loại website | Dùng | |-------------|------| | HTML tĩnh | requests + BeautifulSoup4 | | Render bằng JS | Playwright | | Crawl quy mô lớn | Scrapy | | API ẩn | Playwright HAR → requests |
Code mẫu:
references/bs4-scraper.py — requests + BeautifulSoup cho HTML tĩnhreferences/playwright-scraper.py — Playwright cho trang render JSreferences/reverse-engineer-api.py — Ghi HAR để tìm API ẩnXem thêm: references/scraping-patterns.md, references/anti-ban.md
tools
Upload video tự động lên TikTok, YouTube, Facebook, Instagram bằng browser automation (Playwright). Vì các nền tảng này không có public API cho upload, phải dùng browser automation. Kích hoạt khi user cần upload video lên bất kỳ nền tảng nào.
development
Xử lý video bằng Python — cắt ghép, thêm nhạc nền, phụ đề, watermark, resize, chuyển định dạng, render hàng loạt. Dùng ffmpeg-python và moviepy. Kích hoạt khi user cần xử lý video bất kỳ cách nào.
tools
Lập lịch chạy task tự động — cron job, xử lý hàng đợi, lập lịch hàng loạt. Dùng APScheduler, Celery, hoặc crontab. Kích hoạt khi user cần chạy task định kỳ hoặc xử lý hàng loạt theo lịch.
tools
Quản lý anti-detect browser, đa tài khoản, xoay proxy. Tránh bị phát hiện là bot khi automation. Kích hoạt khi user cần chạy nhiều tài khoản hoặc tránh bị cấm.