批量替换Web Scraper配置中的startUrl - 支持自动清理标点符号
参考网站:trustmrr.com
功能:使用Web Scraper Chrome扩展批量采集TrustMRR上的SaaS公司数据
📖 配置工作原理:
1. _id:Scraper配置的唯一标识符,用于在Web Scraper中识别此采集任务
2. startUrl:起始URL数组,定义采集的入口页面。支持批量添加多个页面URL
3. selectors:选择器数组,定义要提取的数据字段和对应的CSS选择器
4. 数据字段:包括公司名称(name)、头像(pfp)、分类(category)、营收数据(Total revenue/MRR)、订阅数(active subscriptions)、成立时间(Founded)、国家(country)等
5. 选择器类型:支持SelectorText(文本)、SelectorImage(图片)、SelectorLink(链接)等多种数据类型
6. 工作流程:Web Scraper会访问startUrl中的每个页面,根据selectors定义提取数据,最终导出为CSV或JSON格式
💡 这是一个完整的Web Scraper配置,可直接导入Chrome扩展使用。通过批量替换startUrl,可以一次性采集数百个页面的数据
https://trustmrr.com/startup/gumroad?metric=mrr
https://trustmrr.com/startup/easytools-sp-z-o-o?metric=mrr
https://trustmrr.com/startup/maidsnblack?metric=mrr
...
支持带标点:
"https://trustmrr.com/startup/example",
'https://trustmrr.com/startup/example';
https://trustmrr.com/startup/example。
{
"_id": "trustmrr",
"startUrl": ["OLD_URL"],
"selectors": [...]
}
?metric=mrr 参数